高效部署

E-PMQ：基于合并权重锚定的专家引导式后合并量化

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:14.307Z

本文介绍了一种名为E-PMQ的后合并量化框架，旨在解决将多个专家模型合并后进行量化时出现的性能下降问题。该框架通过利用原始专家模型权重作为引导目标，并引入“合并权重锚定”技术来稳定校准过程，以在低比特（如4-bit）部署中保留合并模型的集成能力。实验表明，该方法在多项任务合并的CLIP和FLAN-T5模型上显著提升了量化性能。

精选帖子

E-PMQ：基于合并权重锚定的专家引导式后合并量化

相关作者