Continual Harness：用于具身智能体的免重置自我改进框架

原帖

**Continual Harness：一种用于具身智能体的免重置自我改进框架**

_Continual Harness: A reset-free self-improving harness for embodied agents_

> 该研究提出名为Continual Harness的框架，使具身智能体（如游戏AI）能在单次运行中无需重置环境，通过在线自我优化提示、子智能体、技能和记忆来持续改进。研究者以《宝可梦》系列游戏为测试平台，展示了智能体在长期决策任务中的自主学习能力。其关键创新包括在线流程奖励共同学习循环，利用前沿模型和开源模型结合，实现了在《宝可梦红》等游戏中的显著性能提升，为具身AI的长期自适应发展提供了新方向。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：论文
- **发布时间**：2026-05-23 23:32（北京时间）
- **原文**：[打开原文](https://sethkarten.ai/continual-harness)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该研究提出名为 Continual Harness 的框架，使具身智能体能在单次运行中无需重置环境，通过在线自我优化持续改进。研究者以《宝可梦》系列游戏为测试平台，展示了智能体在长期决策任务中的自主学习能力。

答案说明

Continual Harness 是一个免重置的自我改进框架，它允许具身智能体（如游戏AI）在不重置环境的情况下，通过在线优化提示、子智能体、技能和记忆来持续学习。该框架在《宝可梦》等游戏测试中实现了显著性能提升。

这篇帖子回答的问题

Continual Harness 框架的核心功能是什么？
该研究使用什么平台来验证 Continual Harness 框架的效果？

核心观点

Continual Harness 框架的关键创新在于其在线流程奖励共同学习循环，以及结合前沿模型与开源模型，实现了在《宝可梦红》等游戏中的显著性能提升。
该框架为具身AI的长期自适应发展提供了一种无需重置环境的新方向。

FAQ

Q: Continual Harness 框架如何帮助智能体学习？: A: 该框架通过在线自我优化提示、子智能体、技能和记忆，使智能体在无需重置环境的单次运行中持续改进。
Q: 该研究提到了哪些关键创新？: A: 关键创新包括在线流程奖励共同学习循环，以及结合前沿模型和开源模型。

关键实体

Continual Harness
宝可梦
宝可梦红