**StitchVM:用于扩散模型对齐的拼接值模型**

_Stitched Value Model for Diffusion Alignment_

> 本文提出StitchVM,一种高效的模型拼接框架,用于将预训练在清晰图像上的奖励模型迁移到噪声潜空间,以解决扩散模型对齐中的挑战。该方法将截断的像素空间奖励模型与冻结的扩散骨干网络结合,构建一个能够直接处理噪声潜变量的混合模型,从而避免了传统Tweedie式或蒙特卡洛近似带来的偏差或高计算成本问题。实验表明,StitchVM显著提升了下游引导和后训练方法的效率,例如将DPS加速3.2倍并减半峰值GPU内存,将DiffusionNFT加速2.3倍。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.19804)