咨询下各位1.2 从“聋哑司机”到“司机助理”

> 数据图表

咨询下各位1.2 从“聋哑司机”到“司机助理”

2025-5-0

1.2 从“聋哑司机”到“司机助理”➢ 语言模型、多模态模型被引入智能驾驶领域——EMMA（谷歌旗下Waymo）• 事实上，VLA模型最早见于机器人行业。2023年7月28日，谷歌 DeepMind推出了全球首个控制机器人的视觉语言动作（VLA）模型RT-2。• 2024年10月底，谷歌旗下自动驾驶公司Waymo推出了一个基于端到端的自动驾驶多模态模型EMMA。图表：DeepMind的RT-2概述图表：Waymo的自动驾驶多模态模型EMMA图示资料来源：《EMMA:End-to-EndMultimodalModelforAutonomousDriving》（Jyh-JingHwang等，2024）、《RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControl》（AnthonyBrohan等，2023），国盛证券研究所20

国盛证券科技传媒