**EndPrompt:通过终端锚定高效扩展长上下文窗口**

_EndPrompt: Efficient Long-Context Extension via Terminal Anchoring_

> 本文提出了一种名为EndPrompt的新方法,旨在高效地将大语言模型的上下文窗口从8K扩展到64K。其核心创新在于,无需使用目标长度的完整序列进行昂贵训练,而是通过构建一个包含原始短上下文和附加简短终端提示的两段式结构,来模拟长距离相对位置信息。理论分析基于旋转位置编码,表明该方法能在短序列中引入局部和长程距离,并保持语义连续性。在LLaMA系列模型上的实验显示,EndPrompt在RULER和LongBench基准测试中取得了优于现有方法(如LCEG、LongLoRA和全长度微调)的性能,同时计算成本显著降低。这挑战了必须依赖密集长序列训练才能可靠扩展上下文窗口的普遍假设。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-19 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.14589)