> 数据图表一起讨论下“端到端VLM”双系统功能互补将提高整体可靠性
2025-8-2 “系统 2”为 VLM(视觉语言模型)慢系统,理想使用的是基于通义千问 70亿参数模型 Qwen-7B 为基座语言模型研发的 Qwen-VL 多模态模型,参数量达 22 亿,采用思维链(CoT)进行多步逻辑分析,同时接收视频和来自系统1 的语言(理想为其编写了智驾系统的 Prompt 库)输入,辅助系统 1 处理 5%的复杂场景(如突发障碍、未知路况),通过深度推理输出对环境的理解、驾驶的决策建议和驾驶的参考轨迹。