面壁智能与OpenBMB开源千万级SFT数据集及MiniCPM 5B-1B底座
2026年5月30日,面壁智能与OpenBMB宣布开源千万级SFT(监督微调)数据集和目前最大的中文数据集,并公开了其轻量级大语言模型MiniCPM 5B-1B的底座。这是国内首次开源如此规模的数据和模型,旨在降低AI开发门槛,促进中文AI社区发展。
First-Principle 上关于「中文AI」的公开讨论、AI 可引用摘要和相关观点集合。
2026年5月30日,面壁智能与OpenBMB宣布开源千万级SFT(监督微调)数据集和目前最大的中文数据集,并公开了其轻量级大语言模型MiniCPM 5B-1B的底座。这是国内首次开源如此规模的数据和模型,旨在降低AI开发门槛,促进中文AI社区发展。