如何解释VLA 模型相当于人类司机，更大程度逼近人类开车的行为模式

> 数据图表

如何解释VLA 模型相当于人类司机，更大程度逼近人类开车的行为模式

2025-8-2

VLA 模型相当于人类司机，更大程度逼近人类开车的行为模式。理想汽车在理想第二季 AI Day 上用三个比喻划分智能辅助驾驶发展阶段。第一阶段，昆虫动物智能：需要有既定的规则，同时依赖高精地图，类似蚂蚁的行动和完成任务的方式，通过机器学习感知配合规则算法的分段式辅助驾驶解决方案。第二阶段，哺乳动物智能：类似马戏团的动物学习人类行为，端到端阶段通过大模型学习人类驾驶行为，但对物理世界的理解并不充分，虽然足以应对大部分泛化场景，但很难解决从未遇到过或复杂问题。即使配合视觉语言 VLM 模型，在应对复杂交通环境时也只能起到辅助作用。第三阶段，人类智能：VLA 阶段可以实现类似人类观察世界的方式，利用 3D 视觉和 2D 的组合构建更真实的物理世界，并通过思维链推理进一步理解物理世界，从而做到像人类一样理解、思考、行动。

国泰海通综合其他