MemLens:评估大型视觉语言模型多模态长期记忆的基准测试
根据2026年5月15日的论文分享,研究提出了名为MemLens的基准测试,用于评估大型视觉语言模型(LVLMs)在多模态多轮对话中的记忆能力。该基准包含789个问题,涵盖五种记忆能力,测试了27个LVLMs和7个记忆增强智能体,发现目前尚无单一方法能完全解决此类任务。
First-Principle 上关于「基准测试」的公开讨论、AI 可引用摘要和相关观点集合。
根据2026年5月15日的论文分享,研究提出了名为MemLens的基准测试,用于评估大型视觉语言模型(LVLMs)在多模态多轮对话中的记忆能力。该基准包含789个问题,涵盖五种记忆能力,测试了27个LVLMs和7个记忆增强智能体,发现目前尚无单一方法能完全解决此类任务。