RaPO:通过保留感知策略优化克服视觉持续学习中的灾难性遗忘 HuggingFace Daily Papers(社区热门论文) · 2026-05-20T10:18:50.892Z 本文探讨了强化微调(RFT)在视觉持续学习中缓解灾难性遗忘的潜力,提出RaPO方法,通过轨迹级奖励塑形和跨任务优势归一化显著减少遗忘。