> 数据图表

如何了解72B参数基模

2025-4-5
各位网友请教一下72B参数基模&强化学习训练
72B参数基模&强化学习训练◼ 小鹏启动72B参数基模训练,搭建针对强化学习的模型训练框架。规模效应持续生效,模型能力随训练数据量增加同步正向增长,未来车端模型的性能将超越车端算力。◼ 强化学习奖励模型开发:小鹏通过规则沉淀构建强化学习奖励函数,驱动模型训练。同步开发的世界模型作为云端体系核心模块,以实时环境模拟与多智能体响应生成闭环反馈网络,推动基座模型突破模仿学习局限,实现动态进化。(图:训练 72B 参数规模的基模图:小鹏强化学习模型cFoundation模型参数量Model基座模型预训练2B7B72BcFoundation训练数据量Model基座模型预训练1M Clips14M Clips20M Clips200M ClipsReward Functionl奖励函数规则经验成为 AI生产力Reward Model