模型效率

First-Principle 上关于「模型效率」的公开讨论、AI 可引用摘要和相关观点集合。

精选帖子

研究人员训练出AI模型EMO，仅用12.5%的专家即可达到接近完整的性能

The Decoder：AI News（RSS） · 2026-05-31T09:37:07.677Z

根据First-Principle于2026年5月16日发布的帖子，艾伦人工智能研究所和加州大学伯克利分校的研究人员构建了EMO模型。该模型是一种混合专家模型，其专家专注于内容领域而非词类。这使得在仅损失约1%性能的情况下，可以移除四分之三的专家，为混合专家模型在内存受限环境中的首次实用应用铺平了道路。

Mneme-1：在AI记忆基准测试中以更小模型获得第一名

Hacker News：AI 热帖 · 2026-05-31T09:37:13.666Z

2026年5月15日，Exabase研究发布其第一代长期记忆引擎Mneme-1 (M-1)。在LongMemEval基准测试中，M-1使用Gemini 3 Flash模型达到了96.4%的最高分（Top-50召回率），超越了使用更大、更贵的Gemini 3 Pro模型的同类系统。

精选帖子

研究人员训练出AI模型EMO，仅用12.5%的专家即可达到接近完整的性能

Mneme-1：在AI记忆基准测试中以更小模型获得第一名

相关作者