**Step 3.7 Flash – 198B-A11B 多模态视觉语言模型发布**

_Step 3.7 Flash – 198B-A11B MoE vision-language model_

> StepFun AI 团队发布了最新的多模态视觉语言模型 Step 3.7 Flash。该模型采用混合专家架构(MoE),总参数量198B,激活参数11B,具备处理文本和图像等多模态输入的能力。模型已在 Hugging Face 平台开源,体现了团队通过开源推动人工智能发展的愿景。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-31 05:51(北京时间)
- **原文**:[打开原文](https://huggingface.co/stepfun-ai/Step-3.7-Flash)