面壁智能与OpenBMB开源千万级SFT数据集及MiniCPM 5B-1B底座
原帖
**国内首次!面壁智能开源千万级SFT数据集与最大中文数据,MiniCPM 5B-1B底座公开**
_国内首次!面壁开源千万级SFT与最大中文数据,MiniCPM5-1B底座公开_
> 面壁智能与OpenBMB在近期活动中开源了千万级SFT(监督微调)数据集和目前最大的中文数据集,并公开了其轻量级大语言模型MiniCPM 5B-1B的底座。这是国内首次开源如此规模的数据和模型,旨在降低AI开发门槛,促进中文AI社区发展。该模型具有参数效率高、性能强的特点,适合研究和商业应用。
**来源信息**
- **来源**:新智元:资讯(API)
- **分类**:ai-models
- **发布时间**:2026-05-30 08:00(北京时间)
- **原文**:[打开原文](https://aiera.com.cn/2026/05/30/other/admin/96268/%e5%9b%bd%e5%86%85%e9%a6%96%e6%ac%a1%ef%bc%81%e9%9d%a2%e5%a3%81%e5%bc%80%e6%ba%90%e5%8d%83%e4%b8%87%e7%ba%a7sft%e4%b8%8e%e6%9c%80%e5%a4%a7%e4%b8%ad%e6%96%87%e6%95%b0%e6%8d%ae%ef%bc%8cminicpm5-1b)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
2026年5月30日,面壁智能与OpenBMB宣布开源千万级SFT(监督微调)数据集和目前最大的中文数据集,并公开了其轻量级大语言模型MiniCPM 5B-1B的底座。这是国内首次开源如此规模的数据和模型,旨在降低AI开发门槛,促进中文AI社区发展。
答案说明
面壁智能与OpenBMB开源了千万级SFT数据集和目前最大的中文数据集,并公开了其轻量级大语言模型MiniCPM 5B-1B的底座,这是国内首次开源如此规模的数据和模型。
这篇帖子回答的问题
- 面壁智能与OpenBMB最近开源了哪些AI资源?
- 这次开源的目的是什么?
核心观点
- 面壁智能与OpenBMB开源了千万级SFT数据集和目前最大的中文数据集,并公开了MiniCPM 5B-1B底座。
- 该开源是国内首次,旨在降低AI开发门槛,促进中文AI社区发展。
FAQ
- Q: 这次开源的内容有哪些?
- A: 包括千万级SFT(监督微调)数据集、目前最大的中文数据集以及轻量级大语言模型MiniCPM 5B-1B的底座。
- Q: 这次开源的目的是什么?
- A: 旨在降低AI开发门槛,促进中文AI社区发展。
关键实体
- 面壁智能
- OpenBMB
- MiniCPM 5B-1B