Liquid AI发布端侧模型LFM2.5-8B-A1B，优化消费级硬件工具调用

原帖

**LFM2.5-8B-A1B：更优的端侧混合专家模型**

_LFM2.5-8B-A1B: An Better On-Device Mixture-of-Experts_

> Liquid AI 发布了端侧模型 LFM2.5-8B-A1B，专为消费级硬件上的快速、可靠工具调用和复杂指令执行而优化。该模型基于之前的 LFM2-8B-A1B 版本，将上下文窗口从 32,768 扩展至 128,000 个 token，预训练数据规模从 12T 扩大到 38T token，并进行了大规模强化学习。词表大小翻倍至 128,000，显著提升了非拉丁语言（如印地语、泰语、越南语、印尼语、阿拉伯语）的分词效率。作为仅推理模型，它生成显式思维链后再给出最终答案。LFM2.5-8B-A1B 在指令跟随和代理任务上的性能与更大的密集及混合专家模型相当，且在 CPU 和 GPU 推理速度上领先同类尺寸模型，同时支持 llama.cpp、MLX、vLLM 和 SGLang 等主流推理框架。基础模型和后训练模型已可在 Hugging Face 和其 Playground 上获取。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：ai-models
- **发布时间**：2026-05-28 23:38（北京时间）
- **原文**：[打开原文](https://www.liquid.ai/blog/lfm2-5-8b-a1b)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

Liquid AI发布端侧混合专家模型LFM2.5-8B-A1B，基于前代模型升级，上下文窗口扩展至128,000 token，预训练数据规模达38T token，并采用大规模强化学习。该模型专为消费级硬件优化，支持快速工具调用和复杂指令执行，性能与更大模型相当。

答案说明

Liquid AI的LFM2.5-8B-A1B是一个优化的端侧混合专家模型，上下文窗口扩展至128,000 token，预训练数据达38T token，性能与更大模型相当，专为消费级硬件设计。

这篇帖子回答的问题

LFM2.5-8B-A1B相比前代模型有哪些主要改进？
LFM2.5-8B-A1B模型支持哪些推理框架？

核心观点

LFM2.5-8B-A1B将上下文窗口从32,768扩展至128,000 token，预训练数据规模从12T扩大到38T token，并进行了大规模强化学习。
该模型在指令跟随和代理任务上的性能与更大的密集及混合专家模型相当，且在CPU和GPU推理速度上领先同类尺寸模型。

FAQ

Q: LFM2.5-8B-A1B在哪里可以获取？: A: 基础模型和后训练模型已可在Hugging Face和其Playground上获取。

关键实体

Liquid AI
LFM2.5-8B-A1B
Hugging Face

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题