**LFM2.5-8B-A1B:更优的端侧混合专家模型**

_LFM2.5-8B-A1B: An Better On-Device Mixture-of-Experts_

> Liquid AI 发布了端侧模型 LFM2.5-8B-A1B,专为消费级硬件上的快速、可靠工具调用和复杂指令执行而优化。该模型基于之前的 LFM2-8B-A1B 版本,将上下文窗口从 32,768 扩展至 128,000 个 token,预训练数据规模从 12T 扩大到 38T token,并进行了大规模强化学习。词表大小翻倍至 128,000,显著提升了非拉丁语言(如印地语、泰语、越南语、印尼语、阿拉伯语)的分词效率。作为仅推理模型,它生成显式思维链后再给出最终答案。LFM2.5-8B-A1B 在指令跟随和代理任务上的性能与更大的密集及混合专家模型相当,且在 CPU 和 GPU 推理速度上领先同类尺寸模型,同时支持 llama.cpp、MLX、vLLM 和 SGLang 等主流推理框架。基础模型和后训练模型已可在 Hugging Face 和其 Playground 上获取。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:ai-models
- **发布时间**:2026-05-28 23:38(北京时间)
- **原文**:[打开原文](https://www.liquid.ai/blog/lfm2-5-8b-a1b)