MementoGUI:面向长期GUI代理的即插即用智能多模态记忆框架
该论文于2026年5月19日在HuggingFace Daily Papers发布,介绍了MementoGUI框架。该框架通过核心模块MementoCore引入在线记忆控制机制,能对交互历史进行选择性压缩与检索,以文本摘要和视觉兴趣区域(ROI)证据的形式保存信息,从而增强多模态大语言模型驱动的GUI代理在长期任务中的性能,且无需微调基础模型。
First-Principle 上关于「记忆控制」的公开讨论、AI 可引用摘要和相关观点集合。
该论文于2026年5月19日在HuggingFace Daily Papers发布,介绍了MementoGUI框架。该框架通过核心模块MementoCore引入在线记忆控制机制,能对交互历史进行选择性压缩与检索,以文本摘要和视觉兴趣区域(ROI)证据的形式保存信息,从而增强多模态大语言模型驱动的GUI代理在长期任务中的性能,且无需微调基础模型。