如何解释“端到端VLM”双系统功能互补将提高整体可靠性

> 数据图表

如何解释“端到端VLM”双系统功能互补将提高整体可靠性

2025-8-2

“系统 2”为 VLM（视觉语言模型）慢系统，理想使用的是基于通义千问 70亿参数模型 Qwen-7B 为基座语言模型研发的 Qwen-VL 多模态模型，参数量达 22 亿，采用思维链（CoT）进行多步逻辑分析，同时接收视频和来自系统1 的语言（理想为其编写了智驾系统的 Prompt 库）输入，辅助系统 1 处理 5%的复杂场景（如突发障碍、未知路况），通过深度推理输出对环境的理解、驾驶的决策建议和驾驶的参考轨迹。

国泰海通综合其他