面向大语言模型智能体的自主探索研究 HuggingFace Daily Papers(社区热门论文) · 2026-05-31T09:37:09.911Z 本文指出基于大语言模型的智能体在不熟悉环境中易因‘过早利用’而失败,提出了‘探索检查点覆盖率’指标,并建议采用‘先探索后行动’的训练策略。