多源视觉推理

论文解读：MARS框架如何利用单锚定优势归一化提升多源视觉推理性能

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:10.935Z

针对多源视觉推理中信息整合难题，HuggingFace Daily Papers社区于2026年5月27日分享了MARS框架。该框架将各视觉模态视为独立信息源，通过单源奖励作为动态锚点，将多源信息增益显式纳入强化学习的优势归一化过程，旨在促进源间协同并抑制噪声。据实验报告，在GRPO和DAPO算法上分别取得3.2%和4.9%的性能提升。

精选帖子

论文解读：MARS框架如何利用单锚定优势归一化提升多源视觉推理性能

相关作者