> 数据图表

怎样理解AI 模型持续迭代

2025-5-3
怎样理解AI 模型持续迭代
Scaling Law 拓展至多领域,模型深度思考成为新主线。模型训练方面,Scaling Law 从预训练扩展到后训练和推理阶段,模型不光随着参数量提升而提高性能,还能基于强化学习、思维链等算法创新在后训练和推理阶段更多的算力投入,可以进一步大幅提升大模型的深度思考能力。据 OpenAI 介绍,GPT-4.5 使用了 10 万张 GPU卡进行训练,在开发 OpenAI o3 时在训练计算和推理时间方面都增加了一个数量级,发现了明显的性能提升,验证了模型的性能会随着思考的次数而不断提高,并首次将图片整合到思维链中,算力需求持续提升。模型推理方面,DeepSeek 带来的算法效率的提升并未抑制算力需求,反而因更多的用户和场景的加入,推动 AI 大模型普及与应用落地,进而带动数据中心、边缘及端侧算力建设。