**NVIDIA 发布 Nemotron 3 Ultra:高速、开源权重、550B 参数模型** _Nemotron 3 Ultra: high-speed,
原帖
**NVIDIA 发布 Nemotron 3 Ultra:高速、开源权重、550B 参数模型**
_Nemotron 3 Ultra: high-speed, open weights, 550B params_
> NVIDIA 在 Computex 主题演讲中宣布推出 Nemotron 3 Ultra,这是一个拥有 550B 总参数(55B 活跃参数)的开源权重模型。根据独立分析,它在 Artificial Analysis 智能指数上获得 48 分,成为美国开源权重模型中智能水平最高的,超越了 Gemma 4 31B、Nemotron 3 Super 等模型,但仍落后于中国领先的开源前沿模型(如 Kimi K2.6 的 54 分)。在 DeepInfra 的预发布端点上,该模型推理速度超过每秒 300 个 tokens,远超中国同类模型(50-100 tokens/s)和 gpt-oss-120b。这是 Nemotron 3 系列中最大的模型,计划后续发布 NVFP4 量化版本以提升推理性能。
**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-06-01 20:40(北京时间)
- **原文**:[打开原文](https://artificialanalysis.ai/articles/nvidia-nemotron-3-ultra-launch-announced)