**用分布微调(DFT)修复大语言模型的写作问题**

_Fixing LLM Writing with Distribution Fine Tuning_

> 本文介绍了一种名为“分布微调”(Distribution Fine Tuning,DFT)的新训练算法,旨在解决大语言模型(LLM)写作时过于公式化、过度使用特定词汇或短语的问题。通过使用最大均值差异(MMD)、判断模型质量(JMQ)和L2词符分布等指标,文章量化了标准监督微调(SFT)在匹配训练数据分布上的不足。实验表明,DFT作为后训练步骤,能显著提升模型输出分布与训练分布的匹配度(MMD改善49%,JMQ改善63%),并大幅提升写作质量,包括创造力(+164%)、连贯性(+28%)、清晰度(+16%)和有意义的细节(+146%),同时消除了如过多破折号等“套话”迹象。一个基于DFT的14B参数模型演示已上线。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-19 04:01(北京时间)
- **原文**:[打开原文](https://rosmine.ai/2026/05/18/fixing-llm-writing-with-distribution-fine-tuning)