**Google推出DiffusionGemma:文本生成速度提升4倍的开源实验模型** _DiffusionGemma: 4x Faster Text Ge
原帖
**Google推出DiffusionGemma:文本生成速度提升4倍的开源实验模型**
_DiffusionGemma: 4x Faster Text Generation_
> 谷歌发布开源实验模型DiffusionGemma,采用文本扩散技术,可并行生成文本块,在GPU上实现最高4倍推理加速(H100上1000+ tokens/秒,RTX 5090上700+ tokens/秒)。该模型为26B混合专家(MoE)架构,推理时仅激活3.8B参数,量化后可运行于18GB显存显卡,支持双向注意力,擅长非线性文本任务如代码补全和数独,并能自我纠错。输出质量略低于标准Gemma 4,适合追求速度的实时交互本地工作流。
**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-06-11 00:09(北京时间)
- **原文**:[打开原文](https://blog.google/innovation-and-ai/technology/developers-tools/diffusion-gemma-faster-text-generation)