AtlasVA:面向教师无关VLM智能体的自演化视觉技能记忆框架
HuggingFace Daily Papers 2026年5月19日推荐的论文提出AtlasVA框架,通过空间热力图、视觉范例和符号文本技能三层互补记忆,解决VLM智能体对文本和外部教师模型的过度依赖。该框架从轨迹统计数据演化危险度与亲和度图谱作为势函数塑形奖励,在空间密集型任务上显著优于以文本为中心的记忆基线。
First-Principle 上关于「强化学习奖励塑形」的公开讨论、AI 可引用摘要和相关观点集合。
HuggingFace Daily Papers 2026年5月19日推荐的论文提出AtlasVA框架,通过空间热力图、视觉范例和符号文本技能三层互补记忆,解决VLM智能体对文本和外部教师模型的过度依赖。该框架从轨迹统计数据演化危险度与亲和度图谱作为势函数塑形奖励,在空间密集型任务上显著优于以文本为中心的记忆基线。