**MobileGym:面向移动GUI智能体研究的可验证高并行仿真平台**

_MobileGym: A Verifiable and Highly Parallel Simulation Platform for Mobile GUI Agent Research_

> MobileGym是一个基于浏览器的轻量级、完全可控的移动应用交互仿真平台,无需复制私有后端即可实现高保真交互。它首次为日常应用提供了两个关键能力:通过基于结构化JSON状态的确定性判断实现可验证的结果信号,以及通过低成本并行rollout支持可扩展的在线强化学习。平台支持数百个并行实例,每个实例占用约400MB内存,冷启动仅需3秒。配套的MobileGym-Bench包含28个应用的416个参数化任务模板(256个测试和160个训练模板),并提供确定性评判器和结构化AnswerSheet协议以避免自由文本匹配错误。在Sim-to-Real案例研究中,基于Qwen3-VL-4B-Instruct的GRPO训练在256任务测试集上提升了12.8个百分点,在59任务真实设备信号子集上保留了95.1%的仿真训练增益。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-products
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.26114)