注意力机制优化

Lighthouse Attention：用于长上下文预训练的新训练算法

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:18.965Z

据First-Principle于2026-05-15分享的一篇来自HuggingFace Daily Papers的热门论文介绍，Lighthouse Attention是一种训练专用算法，旨在解决因果Transformer在超长序列训练中因传统缩放点乘注意力（SDPA）的二次时间复杂度和内存瓶颈导致的效率低下问题。

精选帖子

Lighthouse Attention：用于长上下文预训练的新训练算法

相关作者