SAM:面向长期推理智能体的状态自适应记忆框架
原帖
**SAM:面向长期推理智能体的状态自适应记忆框架**
_SAM: State-Adaptive Memory for Long-Horizon Reasoning Agent_
> 本文提出了一种名为状态自适应记忆(SAM)的新框架,用于解决大型语言模型在长期交互中进行智能体推理时面临的信息分散和历史管理难题。与现有截断、压缩或检索历史的方法不同,SAM显式建模了对过去交互的访问如何随智能体状态演变而自适应调整。该框架通过将交互历史压缩为紧凑的记忆线索,同时保留原始轨迹页面以支持意图驱动的回忆,使得智能体能根据当前需求重建时序上遥远的信息,且无需重新训练底层模型。SAM还通过专家引导监督和强化学习优化了记忆模块,使其与轨迹级别的效用对齐。在BrowseComp、BrowseComp-ZH、WideSearch和HLE等多个基准测试中,SAM在不同智能体主干模型上均持续优于强基线,证明了显式记忆建模为长期推理提供了简单有效的基础。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.24468)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
本文介绍了一种名为SAM(状态自适应记忆)的新框架,旨在解决大型语言模型(LLM)在长期交互推理中面临的信息分散和历史管理难题。该框架通过自适应调整对过去交互的访问,并压缩历史为记忆线索,在多个基准测试中表现出色。
答案说明
SAM(状态自适应记忆)是一种用于LLM智能体的新框架,它通过显式建模状态演变来管理长期交互历史,从而提升推理能力。它在BrowseComp等多个基准测试中优于强基线。
这篇帖子回答的问题
- SAM框架如何解决大型语言模型智能体在长期推理中遇到的历史管理难题?
- SAM框架在哪些基准测试中进行了评估?
核心观点
- SAM框架通过显式建模智能体状态如何影响对历史交互的访问,来管理长期推理中的记忆。
- 根据帖子所述,SAM在多个基准测试中持续优于强基线,证明了显式记忆建模对长期推理的有效性。
FAQ
- Q: SAM框架如何帮助智能体回忆长期历史信息?
- A: SAM框架通过将交互历史压缩为记忆线索,并保留原始轨迹页面,使得智能体能根据当前需求重建时序上遥远的信息。
关键实体
- SAM (State-Adaptive Memory)
- 长期推理智能体
- HuggingFace