> 数据图表

如何解释理想智能化软件:下一代VLA模型

2025-6-1
如何解释理想智能化软件:下一代VLA模型
理想智能化软件:下一代VLA模型◼ 下一代架构从端到端+VLM进化成VLA模型。下图为VLA模型架构。图:理想汽车智驾VLA模型数据来源:英伟达GTC大会2024,东吴证券研究所56V—空间智能模块融合时空信息(物体运动轨迹等)处理流程3D特征信息处理摄像头激光雷达位置车辆姿态导航MindVLA核心技术优势L—语言智能模块A—动作策略模块动作输出强化学习模块整合输出最终3D环境特征MindGPT(LLM)解析语言指令语音指令输入语音控制与交互模块扩散解码器驾驶轨迹世界模型优化灵活性噪音对驾驶行为打分,迭代优化策略奖励模型单模型实现快思考(简单场景快速决策)与慢思考(复杂场景推理后决策)从头训练大语言模型,适配车端高效推理基于高斯预训练的3D 标注,提升空间理解能力同时具备空间&语言的处理与响应能力基于扩散模型的核心技术,用于优化车辆在复杂交通环境中的驾驶决策通过人类反馈优化模型决策行为通过构建 “仿真生成 -策略执行 - 反馈优化”的闭环,模型得以在动态的环境中学习更具普适性的决策逻辑