推理效率

一篇报道ICML 2026会议研究的文章指出，针对大语言模型在复杂推理时依赖生成大量Chain-of-Thought中间文本导致效率低下的问题，研究人员提出了一种新方法。该方法允许模型使用极少的“思考标记”来达成深度推理，从而显著减少推理延迟、显存占用和计算成本，同时保持性能。

精选帖子