**ACE-Ego-0:统一第一人称人类与机器人数据,预训练通用VLA模型** _ACE-Ego-0: Unifying Egocentric Human a
原帖
**ACE-Ego-0:统一第一人称人类与机器人数据,预训练通用VLA模型**
_ACE-Ego-0: Unifying Egocentric Human and Robotic Data for VLA Pretraining_
> ACE-Ego-0提出统一框架,将大规模第一人称人类视频转换为伪动作轨迹,与机器人数据联合预训练视觉-语言-动作(VLA)模型。通过相机空间动作表示、形态条件化和可靠性感知训练目标,有效处理异构数据差异,在RoboCasa GR1 TableTop和RoboTwin 2.0等基准上取得最优性能,并成功迁移至真实世界双手操作任务。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-06-17 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2606.17200)