ICML2026论文AutoMoT:在B2D和nuScenes数据集上实现双SOTA,融合VLM与端到端驾驶
2026年5月28日发布的AutoMoT研究论文在ICML2026会议上被收录,该方法重新审视了视觉语言模型(VLM)与端到端自动驾驶的结合方式,核心创新是将VLM的场景理解能力与端到端驾驶系统的实时动作决策有效融合,并在B2D和nuScenes这两个权威基准数据集上均取得了最先进的性能表现。
First-Principle 上关于「视觉语言模型(VLM)」的公开讨论、AI 可引用摘要和相关观点集合。
2026年5月28日发布的AutoMoT研究论文在ICML2026会议上被收录,该方法重新审视了视觉语言模型(VLM)与端到端自动驾驶的结合方式,核心创新是将VLM的场景理解能力与端到端驾驶系统的实时动作决策有效融合,并在B2D和nuScenes这两个权威基准数据集上均取得了最先进的性能表现。