> 数据图表请问一下VLA 模型相当于人类司机,更大程度逼近人类开车的行为模式
2025-8-2VLA 模型相当于人类司机,更大程度逼近人类开车的行为模式。理想汽车在理想第二季 AI Day 上用三个比喻划分智能辅助驾驶发展阶段。第一阶段,昆虫动物智能:需要有既定的规则,同时依赖高精地图,类似蚂蚁的行动和完成任务的方式,通过机器学习感知配合规则算法的分段式辅助驾驶解决方案。第二阶段,哺乳动物智能:类似马戏团的动物学习人类行为,端到端阶段通过大模型学习人类驾驶行为,但对物理世界的理解并不充分,虽然足以应对大部分泛化场景,但很难解决从未遇到过或复杂问题。即使配合视觉语言 VLM 模型,在应对复杂交通环境时也只能起到辅助作用。第三阶段,人类智能:VLA 阶段可以实现类似人类观察世界的方式,利用 3D 视觉和 2D 的组合构建更真实的物理世界,并通过思维链推理进一步理解物理世界,从而做到像人类一样理解、思考、行动。