**Cerebras 将万亿参数推理引入企业级应用,推出 Kimi K2.6 模型**

_Cerebras Brings Trillion Parameter Inference to Enterprises with Kimi K2.6_

> Cerebras 宣布已在企业客户试用中运行 Kimi K2.6——一个领先的万亿参数开源权重模型。该模型在 Cerebras 的硬件上实现了接近每秒 1,000 个 token 的推理速度,比次快的 GPU 云服务快 6.7 倍,比中位数推理提供商快 23 倍。对于包含 10,000 个 token 输入和 500 个 token 输出的请求,Cerebras 仅需 5.6 秒即可完成,而官方端点需要 163.7 秒,效率提升 29 倍。Kimi K2.6 在编程和智能体任务基准测试中表现优异,被认为是闭源前沿模型的开源替代方案。Cerebras 通过其晶圆级引擎、分布式权重存储、高速片上网络和推测解码等技术优化,实现了这一突破,有望极大提升开发者的实时编程效率。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-20 16:54(北京时间)
- **原文**:[打开原文](https://www.cerebras.ai/blog/cerebras-kimi-k2-Enterprise)