> 数据图表

想关注一下1.2 从“聋哑司机”到“司机助理”

2025-5-0
想关注一下1.2 从“聋哑司机”到“司机助理”
1.2 从“聋哑司机”到“司机助理”➢ 语言模型、多模态模型被引入智能驾驶领域——EMMA(谷歌旗下Waymo)• 事实上,VLA模型最早见于机器人行业。2023年7月28日,谷歌 DeepMind推出了全球首个控制机器人的视觉语言动作(VLA)模型RT-2。• 2024年10月底,谷歌旗下自动驾驶公司Waymo推出了一个基于端到端的自动驾驶多模态模型EMMA。图表:DeepMind的RT-2概述图表:Waymo的自动驾驶多模态模型EMMA图示资料来源:《EMMA:End-to-EndMultimodalModelforAutonomousDriving》(Jyh-JingHwang等,2024)、《RT-2:Vision-Language-ActionModelsTransferWebKnowledgetoRoboticControl》(AnthonyBrohan等,2023),国盛证券研究所20