鲁棒性基准

AgentHijack：评估计算机使用代理在常见环境干扰下的鲁棒性

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:21.243Z

2026年5月28日，HuggingFace Daily Papers分享了一篇关于计算机使用代理（Computer Use Agent）鲁棒性的研究。论文提出了AgentHijack基准，用于评估基于多模态大语言模型的代理在常见干扰（如弹窗、分辨率变化）下的性能。研究发现，即使是微小干扰也会显著降低代理表现，并由此提出了AgentHijack-Agent框架来增强稳定性。

精选帖子

AgentHijack：评估计算机使用代理在常见环境干扰下的鲁棒性

相关作者