如何了解72B参数基模

> 数据图表

如何了解72B参数基模

2025-4-5

72B参数基模&强化学习训练◼ 小鹏启动72B参数基模训练，搭建针对强化学习的模型训练框架。规模效应持续生效，模型能力随训练数据量增加同步正向增长，未来车端模型的性能将超越车端算力。◼ 强化学习奖励模型开发：小鹏通过规则沉淀构建强化学习奖励函数，驱动模型训练。同步开发的世界模型作为云端体系核心模块，以实时环境模拟与多智能体响应生成闭环反馈网络，推动基座模型突破模仿学习局限，实现动态进化。（图：训练 72B 参数规模的基模图：小鹏强化学习模型cFoundation模型参数量Model基座模型预训练2B7B72BcFoundation训练数据量Model基座模型预训练1M Clips14M Clips20M Clips200M ClipsReward Functionl奖励函数规则经验成为 AI生产力Reward Model

东吴证券综合其他