**ICML 2026:只用少量Thinking Tokens,大模型依然能深度思考**

_ICML 2026 | 只用少量Thinking Tokens,大模型依然能深度思考_

> 本文报道了ICML 2026上的一项研究,该研究针对当前大语言模型(LLM)在复杂推理中依赖生成大量Chain-of-Thought(CoT)中间文本导致效率低下的问题,提出了一种新方法。该方法允许模型使用极少的“思考标记”(Thinking Tokens)来达成深度推理,从而显著减少了推理延迟、显存占用和计算成本,同时保持了性能。这对于提升大模型在实际应用中的效率和可部署性具有重要意义。

**来源信息**
- **来源**:机器之心:文章库(API)
- **分类**:论文
- **发布时间**:2026-05-18 18:07(北京时间)
- **原文**:[打开原文](https://www.jiqizhixin.com/articles/2026-05-18-12)