**推理模型为何失去覆盖范围?数据与决策点的关键作用**

_Why Do Reasoning Models Lose Coverage? The Role of Data and Forks in the Road_

> 本文研究了大型语言模型中的推理模型在基于SFT的微调后出现的“覆盖范围收缩”现象(即pass@k性能下降)。研究发现,该现象与训练数据中决策点(模型面临多个有效推理路径的场景)的分布密切相关。通过控制实验模拟决策点场景,作者证实了这种相关性,并提出了通过数据合成设计和多样性解码机制来部分缓解该问题的方法。研究强调了数据为中心的因素是收缩的关键驱动因素,并突出了多样性感知设计作为控制该问题的有效手段。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-20 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.17026)