**探索合作流水线:用于序贯社会困境的自主研究**

_Discovering Cooperative Pipelines: Autoresearch for Sequential Social Dilemmas_

> 该研究引入了一个双层自主研究框架,以增强多智能体序贯社会困境(SSD)中的合作。外层AI代理(以编码代理形式运行)自主重构内层流水线,该流水线是用于合成LLM策略的系统。研究员代理R能够阅读源代码、编辑系统提示、反馈函数、辅助库和迭代逻辑,运行评估,并根据自主研究范式决定保留哪些改进。在两个游戏(清理和采集)、两个策略合成LLM和两个福利目标(功利主义效率和罗尔斯式最大化最小原则)的实验中,该研究员代理可靠地超越了人工设计的基线,显著降低了运行间方差,并优于仅优化提示的方法。发现的流水线具有目标依赖性:只有在最大化最小原则下,研究员代理才会向合成器流水线注入明确的公平机制,这一机制类别在其自身目标无关的系统提示和所有效率优化的流水线中均不存在。这支持了一种信息设计解读,即研究员根据福利目标选择向有限理性的合成器揭示哪些信息。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.30003)