**Mneme-1 使用更小、更便宜的模型,在主流AI记忆基准测试中达到第一**

_\#1 on the leading AI memory benchmark using a smaller, cheaper model_

> Exabase研究发布了其第一代长期记忆引擎Mneme-1 (M-1)。在LongMemEval基准测试中,M-1使用Gemini 3 Flash模型达到了96.4%的最高分(Top-50召回率),超越了使用更大、更贵的Gemini 3 Pro模型的同类系统。该结果是在不针对特定问题进行提示工程的情况下取得的,并已考虑到基准测试本身的上限。这项研究强调了在无需依赖超大规模前沿模型的情况下,实现强大长期记忆能力的可能性。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-15 21:19(北京时间)
- **原文**:[打开原文](https://exabase.io/research/exabase-achieves-state-of-the-art-on-longmemeval-benchmark)