**谁拥有这个代理?将AI代理追溯至其所有者**

_Who Owns This Agent? Tracing AI Agents Back to Their Owners_

> arXiv发表了一篇关于AI代理归责问题的论文,首次正式定义了将有害或配置不当的AI代理追溯至部署账户的难题。作者提出了一种基于“金丝雀”的协议方案,授权方可向代理交互流注入特定标记,供应商通过搜索会话日志来定位原始会话和账户。该方案在非对抗性环境中简单有效,对于试图过滤内容的恶意操作者,研究者设计了鲁棒的金丝雀构造,使其无法被抑制而不损害代理自身任务性能。论文评估了多种场景,包括真实世界代理,证明该方法可靠、鲁棒且可扩展。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-18 18:30(北京时间)
- **原文**:[打开原文](https://arxiv.org/abs/2605.16035)