**ACC:编译智能体轨迹用于长上下文训练**

_ACC: Compiling Agent Trajectories for Long-Context Training_

> 本文提出了一种名为‘智能体上下文编译(ACC)’的方法,旨在解决大语言模型在长上下文推理能力上的训练难题。传统方法要么需要昂贵的长文档整理,要么依赖启发式上下文合成。ACC通过将智能体(如搜索、软件工程、数据库查询)在解决问题过程中产生的复杂交互轨迹(包括工具调用和环境观察)转化为长上下文问答对,使模型能够直接学习跨多轮交互的远距离上下文依赖,无需额外标注。实验表明,在MRCR和GraphWalks等长距离依赖任务上,使用ACC训练的Qwen3-30B-A3B模型性能显著提升(MRCR提升18.1分,GraphWalks提升7.6分),接近更大规模的Qwen3-235B-A22B模型,同时保持了在通用基准上的能力。该方法简单有效,可与现有长上下文扩展或训练方法结合,提供可扩展的监督微调数据。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21850)