彩色噪声扩散采样(CNS):一种免训练的扩散模型随机求解器
原帖
**彩色噪声扩散采样:一种提升扩散模型采样效率的新型随机求解器**
_Colored Noise Diffusion Sampling_
> 本文提出了一种名为“彩色噪声采样”(CNS)的新型、免训练的随机求解器,用于改进扩散模型的图像生成质量。传统方法在生成过程中注入均匀白噪声,但未充分利用模型固有的频谱偏差(即先解决低频结构后处理高频细节)。CNS通过一个动态的、随时间和频率变化的调度策略,将注入能量更高效地分配给尚未解决的频率带,从而引导生成分布更接近真实数据流形。实验表明,作为即插即用的推理时间采样器替换,CNS在多种架构(如SiT、JiT、FLUX)上显著优于标准ODE和SDE基线。例如,在ImageNet-256上,CNS将无引导FID从8.26降至6.27(SiT-XL/2),同时在使用分类器自由引导时也获得了一致的FID提升。项目页面已公开。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.30332)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
一篇来自HuggingFace Daily Papers的论文介绍了一种名为“彩色噪声采样”(CNS)的新型免训练随机求解器,旨在改进扩散模型的图像生成质量。该方法通过动态调度策略,将注入能量更高效地分配给未解决的频率带,从而引导生成分布更接近真实数据流形。
答案说明
彩色噪声扩散采样(CNS)是一种新型免训练随机求解器,通过动态、随时间和频率变化的调度策略优化扩散模型采样,将能量高效分配给未解决的频率带,在多种架构上优于标准基线,例如在ImageNet-256上将无引导FID从8.26降至6.27。
这篇帖子回答的问题
- 什么是彩色噪声扩散采样(CNS)?
- CNS方法在实验中取得了什么效果?
核心观点
- CNS是一种免训练的随机求解器,通过动态频率调度策略优化扩散模型采样,旨在将注入能量更高效地分配给未解决的频率带。
- 作为即插即用的推理时间采样器替换,CNS在多种架构上显著优于标准ODE和SDE基线,例如在ImageNet-256上将无引导FID从8.26降至6.27。
FAQ
- Q: CNS方法的核心思想是什么?
- A: CNS的核心思想是利用扩散模型固有的频谱偏差(先解决低频结构后处理高频细节),通过动态频率调度策略,在生成过程中将注入能量更高效地分配给尚未解决的频率带,从而引导生成分布更接近真实数据流形。
关键实体
- 彩色噪声扩散采样 (CNS)
- 扩散模型
- HuggingFace Daily Papers