> 数据图表

想问下各位网友DeepSeek-R1-Zero 算力节省原因

2025-4-4
想问下各位网友DeepSeek-R1-Zero 算力节省原因
训练的不稳定性,同时提高了学习效率。该训练方法首先可以使训练效率的提升,所需训练时间更短,其次是省去了 SFT 和复杂的奖惩模型,从而降低计算资源消耗。