**RT-Lynx:为扩散模型正确运用GEMM稀疏性**

_RT-Lynx: Putting the GEMM Sparsity In a Right Way for Diffusion Models_

> 本文提出了一种名为RT-Lynx的新方法,通过将稀疏性应用于激活而非权重来优化扩散Transformer(DiT)模型的推理效率。研究表明,DiT的激活具有内在稀疏性,对N:M半结构化稀疏化更为鲁棒。该方法结合了误差补偿技术和高度优化的CUDA内核,在保持生成质量的同时,平均实现了1.55倍的线性层推理加速。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.26632)