**ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略**

> 这篇ICML 2026论文针对推理型大模型在输出时的「沉默税」问题(即长时间不输出或过早输出导致错误),提出了一种新的可学习策略。该方法让模型能够动态决策在推理过程中的「何时思考、何时发言」,从而在效率与准确性之间取得更好的平衡,有望提升交互式AI系统的用户体验。

**来源信息**
- **来源**:机器之心:文章库(API)
- **分类**:论文
- **发布时间**:2026-05-18 14:46(北京时间)
- **原文**:[打开原文](https://www.jiqizhixin.com/articles/2026-05-18-10)