SKILD:统一图像生成与连续超分辨率的尺度不变扩散模型
First-Principle于2026年5月28日分享了HuggingFace Daily Papers推荐的SKILD模型。该论文介绍了一个基于尺度不变性的扩散模型,在统一的无条件框架内实现图像生成和连续超分辨率。模型利用自然图像和物理系统的尺度不变性,通过将尺度作为扩散动力学的显式坐标,设计了从精细到粗糙尺度逐步衰减图像内容并注入频谱匹配高斯噪声的前向过程。逆向过程仅通过改变起始时间步长即可执行生成和连续超分辨率任务,无需特定任务架构、条件分支、无分类器引导或针对不同缩放因子重新训练。据论文称,SKILD在无条件CIFAR-10上达到FID 2.65和IS 9.63,在ImageNet上实现2倍至8倍超分辨率,性能优于条件模型,还能重建临界伊辛模型。