**NGM:一种用于LLM的即插即用、无需训练的记忆模块**

_NGM: A Plug-and-Play Training-Free Memory Module for LLMs_

> 本文提出了NGM(N-gram Memory),一种用于大语言模型的即插即用、无需训练的记忆模块。它通过因果N-gram编码器和基于余弦门的记忆注入器,在不需要额外训练、参数或检索流程的情况下,直接利用主干模型的预训练词嵌入构建N-gram表示,并将其注入模型上下文。在Qwen3系列模型(0.6B至14B)上的评估显示,NGM在代码生成和知识密集型任务(如LiveCodeBench和GPQA)上带来了显著性能提升(最高达+3.0分),并提高了多模态基准的表现。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-19 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.16893)