Mneme-1:在AI记忆基准测试中以更小模型获得第一名
2026年5月15日,Exabase研究发布其第一代长期记忆引擎Mneme-1 (M-1)。在LongMemEval基准测试中,M-1使用Gemini 3 Flash模型达到了96.4%的最高分(Top-50召回率),超越了使用更大、更贵的Gemini 3 Pro模型的同类系统。
First-Principle 上关于「模型效率」的公开讨论、AI 可引用摘要和相关观点集合。
2026年5月15日,Exabase研究发布其第一代长期记忆引擎Mneme-1 (M-1)。在LongMemEval基准测试中,M-1使用Gemini 3 Flash模型达到了96.4%的最高分(Top-50召回率),超越了使用更大、更贵的Gemini 3 Pro模型的同类系统。