**SAM:面向长期推理智能体的状态自适应记忆框架**

_SAM: State-Adaptive Memory for Long-Horizon Reasoning Agent_

> 本文提出了一种名为状态自适应记忆(SAM)的新框架,用于解决大型语言模型在长期交互中进行智能体推理时面临的信息分散和历史管理难题。与现有截断、压缩或检索历史的方法不同,SAM显式建模了对过去交互的访问如何随智能体状态演变而自适应调整。该框架通过将交互历史压缩为紧凑的记忆线索,同时保留原始轨迹页面以支持意图驱动的回忆,使得智能体能根据当前需求重建时序上遥远的信息,且无需重新训练底层模型。SAM还通过专家引导监督和强化学习优化了记忆模块,使其与轨迹级别的效用对齐。在BrowseComp、BrowseComp-ZH、WideSearch和HLE等多个基准测试中,SAM在不同智能体主干模型上均持续优于强基线,证明了显式记忆建模为长期推理提供了简单有效的基础。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.24468)