安全扩散模型

根据HuggingFace Daily Papers于2026年5月19日发布的论文介绍，SafeDiffusion-R1是一种新的在线强化学习框架，旨在解决扩散模型移除预训练中学到的不安全内容时面临的监督数据昂贵、离线方法导致灾难性遗忘和生成质量下降的问题。

精选帖子