MobileEgo Anywhere：利用普通硬件采集长时长自我中心数据的开源框架

原帖

**MobileEgo Anywhere：基于普通硬件的长时长自我中心数据开源基础设施**

_MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware_

> 该论文提出了MobileEgo Anywhere框架，旨在利用智能手机等普通移动硬件，收集长时间（超过一小时）的自我中心视角轨迹数据，以解决现有视觉-语言-动作（VLA）模型训练数据集时长过短的问题。其核心贡献包括：发布了一个包含200小时多样化长片段自我中心数据的新型数据集；开源了一个允许用户录制此类数据的移动应用；以及提供了一个完整的处理流程，可将原始移动采集数据转换为标准化的训练格式，以支持VLA模型和基础模型的研究。该工作旨在通过降低数据收集门槛，加速通用机器人策略的开发。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-18 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.05945)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该论文介绍了MobileEgo Anywhere框架，利用智能手机等普通硬件收集超过一小时的自我中心视角数据，以解决现有VLA模型训练数据时长过短的问题。框架包括一个200小时的数据集、一个移动录制应用和一个完整数据处理流程。

答案说明

MobileEgo Anywhere是一个开源框架，旨在利用智能手机等普通硬件采集长时长（超过1小时）的自我中心视角轨迹数据，以支持视觉-语言-动作（VLA）模型的训练。其核心贡献包括发布了一个200小时的数据集、一个移动录制应用和一个数据处理流程。

这篇帖子回答的问题

MobileEgo Anywhere框架旨在解决什么问题？

核心观点

MobileEgo Anywhere框架的核心贡献包括发布了一个包含200小时多样化长片段自我中心数据的新型数据集。

FAQ

Q: MobileEgo Anywhere提供了哪些核心资源？: A: 根据帖子，该框架的核心资源包括一个200小时的数据集、一个移动录制应用和一个完整的数据处理流程。

关键实体

MobileEgo Anywhere
视觉-语言-动作（VLA）模型