MiniMax-M2系列：基于混合专家架构的智能体语言模型

原帖

**MiniMax-M2系列：微型激活释放最大现实世界智能**

_The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence_

> MiniMax-M2系列是一组基于混合专家（MoE）架构的语言模型，其核心理念是微型激活可释放最大现实世界智能。旗舰模型M2总参数229.9B，但每个token仅激活9.8B参数。该系列专为智能体部署设计，包含三大组件：一是智能体驱动数据管道，可生成大规模、可验证的轨迹数据；二是可扩展的智能体原生强化学习系统Forge，支持长周期轨迹处理与训练-推理解耦；三是最新M2.7检查点已初步实现自我进化，能自主调试训练并修改自身框架。从M2到M2.7，该系列在智能体编程、深度搜索、办公任务和推理基准测试中达到了前沿性能。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-27 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.26494)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

2026年5月27日，HuggingFace Daily Papers发布的社区热门论文介绍了MiniMax-M2系列语言模型。该系列基于混合专家（MoE）架构，旗舰模型总参数229.9B，每个token仅激活9.8B参数，专为智能体部署设计。其核心组件包括智能体驱动数据管道、强化学习系统Forge以及能初步自我进化的M2.7检查点。

答案说明

MiniMax-M2系列是基于混合专家架构的语言模型，总参数229.9B，每token激活9.8B参数。它专为智能体部署设计，包含数据管道、强化学习系统Forge和能自我进化的M2.7检查点，在智能体编程、深度搜索等任务中表现出色。

这篇帖子回答的问题

MiniMax-M2系列语言模型的核心架构和设计理念是什么？
MiniMax-M2系列为智能体部署设计了哪些关键组件？

核心观点

MiniMax-M2系列采用混合专家架构，通过仅激活小部分参数（9.8B）来处理每个token，旨在以高效方式释放大规模模型（229.9B）的现实世界智能。
该系列专为智能体设计，其最新M2.7检查点已初步展现出自我进化能力，能自主调试训练过程和修改自身框架。

FAQ

Q: MiniMax-M2系列在哪些任务上表现出色？: A: 帖子称，从M2到M2.7，该系列在智能体编程、深度搜索、办公任务和推理基准测试中达到了前沿性能。

关键实体

MiniMax-M2
Forge
HuggingFace Daily Papers