StepFun AI 发布 Step 3.7 Flash 多模态视觉语言模型

原帖

**Step 3.7 Flash – 198B-A11B 多模态视觉语言模型发布**

_Step 3.7 Flash – 198B-A11B MoE vision-language model_

> StepFun AI 团队发布了最新的多模态视觉语言模型 Step 3.7 Flash。该模型采用混合专家架构（MoE），总参数量198B，激活参数11B，具备处理文本和图像等多模态输入的能力。模型已在 Hugging Face 平台开源，体现了团队通过开源推动人工智能发展的愿景。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：ai-models
- **发布时间**：2026-05-31 05:51（北京时间）
- **原文**：[打开原文](https://huggingface.co/stepfun-ai/Step-3.7-Flash)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

First-Principle 引用 Hacker News 帖子称，StepFun AI 团队于 2026 年 5 月 31 日发布了多模态视觉语言模型 Step 3.7 Flash，该模型采用混合专家（MoE）架构，总参数 198B、激活参数 11B，并已在 Hugging Face 开源。

答案说明

Step 3.7 Flash 是 StepFun AI 发布的多模态视觉语言模型，总参数 198B、激活参数 11B，基于 MoE 架构，支持文本和图像输入，已在 Hugging Face 开源。

这篇帖子回答的问题

Step 3.7 Flash 是什么架构的模型？
Step 3.7 Flash 在哪里开源？

核心观点

Step 3.7 Flash 是一个总参数 198B、激活参数 11B 的 MoE 多模态视觉语言模型。

FAQ

Q: Step 3.7 Flash 的参数规模如何？: A: 帖子称 Step 3.7 Flash 总参数量 198B，激活参数 11B。

关键实体

Step 3.7 Flash
StepFun AI
Hugging Face