> 数据图表

如何解释DeepSeek-R1 蒸馏模型与其他推理模型对比

2025-4-3
如何解释DeepSeek-R1 蒸馏模型与其他推理模型对比
团队微调了几种在研究界广泛使用的密集模型。仅采用监督微调(SFT),蒸馏方法显著增强了小模