**Mem-π:通过学习何时及生成什么实现自适应记忆**

_Mem-π: Adaptive Memory through Learning When and What to Generate_

> 论文提出了Mem-π框架,用于大型语言模型(LLM)智能体的自适应记忆。与传统从外部记忆库检索静态条目不同,Mem-π利用独立的模型根据当前上下文动态生成特定指导,同时决定何时生成以及生成什么内容。该框架通过解耦决策与内容的强化学习目标进行训练,能在无需指导时选择不生成,否则提供简洁有用的指导。在网页导航、终端工具使用和基于文本的交互等多个智能体基准测试中,Mem-π显著优于基于检索的方法和先前的RL优化记忆基线,在网页导航任务上相对提升超过30%。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-21 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21463)