**腾讯混元提出Stem稀疏注意力算法,首字延迟降低3.6倍** _腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍_ > 腾讯混元提出St
原帖
**腾讯混元提出Stem稀疏注意力算法,首字延迟降低3.6倍**
_腾讯混元提出 Stem 稀疏注意力算法,首字延迟降低 3.6 倍_
> 腾讯混元提出Stem稀疏注意力算法,通过Token位置衰减和输出感知度量,仅用25%算力逼近稠密注意力精度,128K上下文下首字延迟降低3.6倍。论文被ICML-26收录,并开源代码和算子。
**来源信息**
- **来源**:IT之家(RSS)
- **分类**:论文
- **发布时间**:2026-06-05 20:38(北京时间)
- **原文**:[打开原文](https://www.ithome.com/0/960/712.htm)