**先思考再约束:面向大型语言模型的统一解码框架**

_Thinking Before Constraining: A Unified Decoding Framework for Large Language Models_

> 本文提出一种名为“In-Writing”的混合解码方法,结合了自由生成和结构化输出的优势。该方法允许大型语言模型先进行无约束推理,在生成特定触发词后再应用结构化解码,从而有效解决了早期约束导致推理中断的问题。实验表明,该方法在分类和推理任务中比自然生成最高提升了27%的准确率,代码已开源。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2601.07525)