**国内首次!面壁智能开源千万级SFT数据集与最大中文数据,MiniCPM 5B-1B底座公开**

_国内首次!面壁开源千万级SFT与最大中文数据,MiniCPM5-1B底座公开_

> 面壁智能与OpenBMB在近期活动中开源了千万级SFT(监督微调)数据集和目前最大的中文数据集,并公开了其轻量级大语言模型MiniCPM 5B-1B的底座。这是国内首次开源如此规模的数据和模型,旨在降低AI开发门槛,促进中文AI社区发展。该模型具有参数效率高、性能强的特点,适合研究和商业应用。

**来源信息**
- **来源**:新智元:资讯(API)
- **分类**:ai-models
- **发布时间**:2026-05-30 08:00(北京时间)
- **原文**:[打开原文](https://aiera.com.cn/2026/05/30/other/admin/96268/%e5%9b%bd%e5%86%85%e9%a6%96%e6%ac%a1%ef%bc%81%e9%9d%a2%e5%a3%81%e5%bc%80%e6%ba%90%e5%8d%83%e4%b8%87%e7%ba%a7sft%e4%b8%8e%e6%9c%80%e5%a4%a7%e4%b8%ad%e6%96%87%e6%95%b0%e6%8d%ae%ef%bc%8cminicpm5-1b)