**E-PMQ:基于合并权重锚定的专家引导式后合并量化**

_E-PMQ: Expert-Guided Post-Merge Quantization with Merged-Weight Anchoring_

> 本文提出了一种名为E-PMQ的后合并量化框架。该框架旨在解决将多个专家模型合并后进行量化时,性能下降的问题。它通过利用原始专家模型的权重作为引导目标,并引入“合并权重锚定”技术来稳定校准过程,从而在低比特(如4-bit)部署中有效保留合并模型的集成能力。实验表明,在多项任务合并的CLIP和FLAN-T5模型上,E-PMQ显著提升了量化后模型的性能。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-19 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.16882)