ICML 2026论文：解决大模型“沉默税”问题的可学习策略

原帖

**ICML 2026 ｜让大模型边想边说：这篇文章把「何时开口」变成可学习策略**

> 这篇ICML 2026论文针对推理型大模型在输出时的「沉默税」问题（即长时间不输出或过早输出导致错误），提出了一种新的可学习策略。该方法让模型能够动态决策在推理过程中的「何时思考、何时发言」，从而在效率与准确性之间取得更好的平衡，有望提升交互式AI系统的用户体验。

**来源信息**
- **来源**：机器之心：文章库（API）
- **分类**：论文
- **发布时间**：2026-05-18 14:46（北京时间）
- **原文**：[打开原文](https://www.jiqizhixin.com/articles/2026-05-18-10)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

针对推理型大模型输出时的“沉默税”问题，即长时间不输出或过早输出导致错误，一篇ICML 2026论文提出了一种新的可学习策略。该方法使模型能动态决策在推理过程中“何时思考、何时发言”，以在效率与准确性间取得更好平衡，有望提升交互式AI系统的用户体验。

该ICML 2026论文提出一种新方法，让大模型学习何时输出内容，以解决长时间沉默或过早输出导致的错误问题，从而平衡推理效率与准确性。

原帖