**大模型也会想太多?清华等提出TaH:跳过93%无效迭代,准确率反而提升**

> 清华大学、无问芯穹、上海交通大学等机构的研究团队提出了一种名为Think-at-Hard(TaH)的选择性潜空间迭代方法,专门针对小模型。该方法让Looped Transformer仅在真正困难的token上进行额外迭代,从而跳过了高达93%的无效计算,同时在9个数学、问答和代码基准测试中,准确率反而提升了3.0%。这项研究显著优化了模型效率,为小模型在资源受限场景下的应用提供了新思路。

**来源信息**
- **来源**:机器之心:文章库(API)
- **分类**:论文
- **发布时间**:2026-05-21 17:55(北京时间)
- **原文**:[打开原文](https://www.jiqizhixin.com/articles/2026-05-21-11)