视觉语言模型（VLM）

2026年5月28日发布的AutoMoT研究论文在ICML2026会议上被收录，该方法重新审视了视觉语言模型（VLM）与端到端自动驾驶的结合方式，核心创新是将VLM的场景理解能力与端到端驾驶系统的实时动作决策有效融合，并在B2D和nuScenes这两个权威基准数据集上均取得了最先进的性能表现。

精选帖子