**ICML2026 | AutoMoT: 在B2D和nuScenes数据集上达到双SOTA,重新思考VLM与端到端驾驶的结合**

_ICML2026 | AutoMoT : B2D & nuScense双SOTA ,重新思考VLM和端到端驾驶的结合_

> 本文介绍了AutoMoT方法,该研究重新审视了视觉语言模型(VLM)与端到端自动驾驶的结合方式。核心创新在于将VLM强大的场景理解能力(如识别车辆意图、行人行为、复杂路口关系)与端到端驾驶系统需要的实时动作决策(如减速、轨迹偏移、绕行)有效融合。该方法在B2D和nuScenes这两个权威自动驾驶基准数据集上均取得了最先进的性能表现,展示了将大模型理解转化为驾驶决策的有效路径,是自动驾驶感知决策一体化的重要进展。

**来源信息**
- **来源**:机器之心:文章库(API)
- **分类**:论文
- **发布时间**:2026-05-28 13:17(北京时间)
- **原文**:[打开原文](https://www.jiqizhixin.com/articles/2026-05-28-9)