模型后训练

First-Principle 上关于「模型后训练」的公开讨论、AI 可引用摘要和相关观点集合。

精选帖子

语义生成式调优（SGT）：解决统一多模态模型视觉理解与生成对齐的新范式

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:08.065Z

该研究提出语义生成式调优（SGT）范式，旨在解决统一多模态模型（UMMs）中视觉理解与生成表示空间不对齐的核心问题。SGT通过将图像分割作为高级语义代理任务，并采用生成式优化方法，成功桥接了模型内部的视觉理解与生成隔离。

SafeDiffusion-R1：用于安全扩散模型后训练的在线奖励引导框架

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:11.933Z

根据HuggingFace Daily Papers于2026年5月19日发布的论文介绍，SafeDiffusion-R1是一种新的在线强化学习框架，旨在解决扩散模型移除预训练中学到的不安全内容时面临的监督数据昂贵、离线方法导致灾难性遗忘和生成质量下降的问题。

相关作者