StitchVM：一种用于扩散模型对齐的高效模型拼接框架

原帖

**StitchVM：用于扩散模型对齐的拼接值模型**

_Stitched Value Model for Diffusion Alignment_

> 本文提出StitchVM，一种高效的模型拼接框架，用于将预训练在清晰图像上的奖励模型迁移到噪声潜空间，以解决扩散模型对齐中的挑战。该方法将截断的像素空间奖励模型与冻结的扩散骨干网络结合，构建一个能够直接处理噪声潜变量的混合模型，从而避免了传统Tweedie式或蒙特卡洛近似带来的偏差或高计算成本问题。实验表明，StitchVM显著提升了下游引导和后训练方法的效率，例如将DPS加速3.2倍并减半峰值GPU内存，将DiffusionNFT加速2.3倍。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-21 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.19804)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

本文提出StitchVM，通过将奖励模型与冻结的扩散骨干网络拼接，直接处理噪声潜空间，以提升扩散模型对齐的效率并减少偏差或计算成本。

答案说明

StitchVM是一种模型拼接框架，用于将预训练在清晰图像上的奖励模型迁移到噪声潜空间，以解决扩散模型对齐问题，旨在避免传统方法的偏差或高计算成本，并显著提升了下游引导和后训练方法的效率。

这篇帖子回答的问题

StitchVM是什么？它如何解决扩散模型对齐的挑战？
StitchVM在实验中提升了哪些方法的效率？

核心观点

StitchVM通过将奖励模型与冻结的扩散骨干网络拼接，构建一个能够直接处理噪声潜变量的混合模型，从而避免了传统Tweedie式或蒙特卡洛近似带来的偏差或高计算成本问题。
根据实验，StitchVM显著提升了下游引导和后训练方法的效率，例如将DPS加速3.2倍并减半峰值GPU内存，将DiffusionNFT加速2.3倍。

FAQ

Q: StitchVM如何避免传统方法的偏差或高计算成本？: A: StitchVM通过构建一个能够直接处理噪声潜变量的混合模型，从而避免了传统Tweedie式或蒙特卡洛近似带来的偏差或高计算成本问题。
Q: StitchVM对哪些下游方法有加速效果？: A: 根据实验，StitchVM显著提升了下游引导和后训练方法的效率，例如将DPS加速3.2倍并减半峰值GPU内存，将DiffusionNFT加速2.3倍。

关键实体

StitchVM
扩散模型
奖励模型

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题