**ACE-Ego-0：统一第一人称人类与机器人数据，预训练通用VLA模型** _ACE-Ego-0: Unifying Egocentric Human a

原帖

**ACE-Ego-0：统一第一人称人类与机器人数据，预训练通用VLA模型**

_ACE-Ego-0: Unifying Egocentric Human and Robotic Data for VLA Pretraining_

> ACE-Ego-0提出统一框架，将大规模第一人称人类视频转换为伪动作轨迹，与机器人数据联合预训练视觉-语言-动作（VLA）模型。通过相机空间动作表示、形态条件化和可靠性感知训练目标，有效处理异构数据差异，在RoboCasa GR1 TableTop和RoboTwin 2.0等基准上取得最优性能，并成功迁移至真实世界双手操作任务。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-06-17 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2606.17200)