视频扩散模型

针对视频扩散模型对齐的计算瓶颈，Flash-GRPO框架通过单步训练、等时分组消除时间步混淆方差、以及时间梯度校正，在低计算预算下实现了超越全轨迹训练的对齐质量和更高的训练效率。

精选帖子