**AgentHijack:评估计算机使用代理在常见环境干扰下的鲁棒性**

_AgentHijack: Benchmarking Computer Use Agent Robustness to Common Environment Corruptions_

> 本文介绍了AgentHijack,一个用于评估基于多模态大语言模型(MLLM)的计算机使用代理在常见环境干扰(如弹窗、分辨率变化、应用竞争)下鲁棒性的基准。研究发现,即使是微小的干扰也会导致代理性能显著下降,突显了代理的脆弱性和鲁棒性评估的必要性。随后,作者提出了AgentHijack-Agent框架,通过增强动作生成的定位能力和引入环境检查观察器来提升代理的稳定性,并通过实验验证了其有效性。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-28 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.25707)