RAVEN:基于CM-GRPO的实时自回归视频外推网络
原帖
**RAVEN:基于一致性模型GRPO的实时自回归视频外推网络**
_RAVEN: Real-time Autoregressive Video Extrapolation with Consistency-model GRPO_
> 论文提出RAVEN(实时自回归视频外推网络),通过重构训练时的自回归生成过程,使模型在训练阶段就能对齐推理时的历史依赖,从而提升长时程视频生成的质量。同时,作者提出了CM-GRPO(一致性模型组相对策略优化)方法,将一致性采样步骤重构为条件高斯转移并应用在线强化学习,避免了传统方法中的辅助过程。实验表明,RAVEN在质量、语义和动态评价指标上超越了现有基线,而CM-GRPO能进一步提升其性能。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15190)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
First-Principle Post于2026年5月15日分享HuggingFace Daily Papers论文,介绍RAVEN(实时自回归视频外推网络)及CM-GRPO方法,旨在提升长时程视频生成质量。
答案说明
论文提出RAVEN,通过重构训练时的自回归生成过程对齐推理时的历史依赖,提升长时程视频生成质量。同时提出CM-GRPO(一致性模型组相对策略优化),将一致性采样步骤重构为条件高斯转移并应用在线强化学习。实验表明RAVEN在质量、语义和动态评价指标上超越现有基线,CM-GRPO能进一步提升其性能。
这篇帖子回答的问题
- RAVEN是什么?
- CM-GRPO方法的核心思想是什么?
核心观点
- RAVEN通过重构训练时的自回归生成过程,使模型在训练阶段就能对齐推理时的历史依赖,从而提升长时程视频生成的质量。
- CM-GRPO将一致性采样步骤重构为条件高斯转移并应用在线强化学习,避免了传统方法中的辅助过程,并能进一步提升RAVEN的性能。
FAQ
- Q: RAVEN的主要创新点是什么?
- A: RAVEN的主要创新点是重构训练时的自回归生成过程,使模型在训练阶段就能对齐推理时的历史依赖,从而提升长时程视频生成的质量。
关键实体
- RAVEN
- CM-GRPO
- HuggingFace Daily Papers