Cohere开源Command A+:218B参数MoE模型,仅需两块H100运行
原帖
**Cohere开源Command A+:218B MoE模型,仅需两块H100即可运行**
_Cohere Open-Sources Command A+, a 218B Moe Model That Runs on Two H100s_
> Cohere基于其企业AI工作空间North的实际部署经验,开源了Command A+模型。这是一个拥有218B总参数、但推理时仅激活25B参数的混合专家(MoE)模型,旨在替代原有Command A家族的五个专用模型。它在代理式问答、电子表格分析和多会话记忆等任务上性能显著提升,并支持48种语言、多模态推理和工具使用。其关键优势在于效率:通过MoE架构和W4A4量化,它可在两块NVIDIA H100 GPU或单块Blackwell GPU上运行,且推理速度比前代模型快最多63%。该模型已在Hugging Face上以Apache 2.0许可证开源。
**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-23 19:22(北京时间)
- **原文**:[打开原文](https://firethering.com/cohere-command-a-plus-open-source-enterprise-ai-model)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
据2026年5月23日First-Principle平台发布的Hacker News热帖,Cohere开源了Command A+模型,这是一个拥有218B总参数、推理时激活25B参数的MoE模型。该模型旨在替代原有Command A家族的五个专用模型,在代理式问答等任务上性能显著提升,并支持48种语言和多模态推理。其关键优势在于通过MoE架构和W4A4量化,可在两块NVIDIA H100 GPU上运行,推理速度比前代模型快最多63%。
答案说明
根据该帖子,Cohere开源的Command A+是一个高效的大型语言模型,通过混合专家(MoE)架构和量化技术,在保持强大性能的同时大幅降低了推理所需的硬件门槛和成本,使其能在常见的商用GPU上部署。
这篇帖子回答的问题
- Cohere Command A+模型的主要技术特点是什么?
- Command A+模型相比前代Command A家族有什么改进?
核心观点
- 据帖子称,Cohere开源的Command A+模型是一个218B参数的MoE模型,推理时仅激活25B参数,可在两块H100 GPU上运行。
- 该模型旨在替代原有Command A家族的五个专用模型,并在多项企业任务(如代理式问答)上提升了性能和效率。
FAQ
- Q: Command A+模型是开源的吗?
- A: 是的,根据帖子,该模型已在Hugging Face上以Apache 2.0许可证开源。
- Q: 运行Command A+模型需要什么样的硬件?
- A: 帖子称,通过MoE架构和W4A4量化,该模型可在两块NVIDIA H100 GPU或单块Blackwell GPU上运行。
关键实体
- Cohere
- Command A+
- NVIDIA H100
- 混合专家(MoE)