**Causal Forcing++:面向实时交互视频生成的可扩展少步自回归扩散蒸馏**

_Causal Forcing++: Scalable Few-Step Autoregressive Diffusion Distillation for Real-Time Interactive Video Generation_

> 本文针对实时交互视频生成对低延迟、流式和可控性的要求,提出了一种名为Causal Forcing++的新方法。该方法通过因果一致性蒸馏(Causal CD)技术,实现了仅需1-2步采样的逐帧自回归生成,解决了现有方法在生成粒度和采样延迟上的瓶颈。相比现有的4步分块Causal Forcing方法,新方法在VBench和VisionReward等视频质量评估指标上取得显著提升,同时将首帧延迟降低50%,并大幅减少了第二阶段训练成本。该研究还将流程扩展到了动作条件下的世界模型生成。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15141)