**Fast-dDrive:面向自动驾驶的高效块扩散视觉语言动作模型**

_Fast-dDrive: Efficient Block-Diffusion VLM for Autonomous Driving_

> 该论文提出Fast-dDrive,一种用于端到端自动驾驶的块扩散视觉语言动作(VLA)模型,旨在解决现有自回归模型在边缘硬件上的内存带宽限制和暴露偏差问题。模型通过语义单元内的双向细化和严格的因果排序,结合结构化token的冻结与分段感知训练,优先处理安全关键规划。此外,引入了推测解码和测试时缩放方案,在WOD-E2E和nuScenes数据集上实现了最优轨迹规划精度和显著吞吐量提升(12倍加速),为车载实时部署提供了高效解决方案。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-28 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.23163)