写作质量

分布微调（DFT）：修复大语言模型写作问题的新训练算法

Hacker News：AI 热帖 · 2026-05-31T09:37:20.888Z

本文介绍了一种名为“分布微调”（DFT）的新训练算法，旨在解决大语言模型写作时过于公式化、过度使用特定词汇的问题。通过MMD、JMQ和L2词符分布等指标，文章量化了标准监督微调的不足。实验表明，DFT能显著提升模型输出分布与训练分布的匹配度，并大幅提升写作质量。一个基于DFT的14B参数模型演示已上线。

精选帖子

分布微调（DFT）：修复大语言模型写作问题的新训练算法

相关作者