**RoPE在长上下文中无法区分位置与词元:理论证明**

_RoPE Distinguishes Neither Positions Nor Tokens in Long Contexts, Provably_

> 该论文系统性地揭示了旋转位置编码(RoPE)在Transformer长上下文语言模型中的固有局限性。理论分析表明,随着上下文长度增加,基于RoPE的注意力机制会逐渐失去局部性偏置(即无法优先关注邻近位置)和词元相关性一致性(即相同关键向量在不同位置可能获得相反的注意力评分),其失败概率趋近于0.5。进一步证明调整RoPE基准超参数只能在区分位置与区分词元之间进行权衡,无法同时保留两者。实证分析表明,多头多层架构也无法克服这些限制。研究指出,未来可能需要全新的位置编码机制来支持真正的长上下文建模。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-20 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15514)