> 数据图表谁知道地平线世界模型和传统地图对比2025-5-4交互式博弈:为实现理解周遭及自身的运行情况,通过感知-认知-博弈-决策-行动的循环,选择最有利的驾驶逻辑对此地平线提出“交互式博弈”,核心在于通过生成式规控 GPM、安全性规控学习 SE ditor、混合强化学习方法 PEX,以数据驱动学习框架的方式兼具模仿学习的效率及强化学习的闭环效果,相比模仿学习碰撞率降低了 50%,相比强化学习舒适度提升了 20%。我们认为,生成式规控利用生成大模型强大的理解能力,理解不同场景下的最优行为模式,安全性规控学习则帮助定义一系列的安全规则和约束条件,混合强化学习方法来提高提高学习效率和策略性能,统合成理解执行顺滑、安全边界清晰、运行效率出色的模型体系。信达证券综合其他