Pinductor:利用LLM先验从观测学习POMDP世界模型 HuggingFace Daily Papers(社区热门论文) · 2026-05-31T09:37:15.953Z 论文提出Pinductor方法,利用大型语言模型作为先验,从少量观察-动作轨迹生成并优化POMDP世界模型,无需访问隐藏状态,性能随LLM能力提升而提升。