MobileEgo Anywhere:利用普通硬件采集长时长自我中心数据的开源框架
原帖
**MobileEgo Anywhere:基于普通硬件的长时长自我中心数据开源基础设施**
_MobileEgo Anywhere: Open Infrastructure for long horizon egocentric data on commodity hardware_
> 该论文提出了MobileEgo Anywhere框架,旨在利用智能手机等普通移动硬件,收集长时间(超过一小时)的自我中心视角轨迹数据,以解决现有视觉-语言-动作(VLA)模型训练数据集时长过短的问题。其核心贡献包括:发布了一个包含200小时多样化长片段自我中心数据的新型数据集;开源了一个允许用户录制此类数据的移动应用;以及提供了一个完整的处理流程,可将原始移动采集数据转换为标准化的训练格式,以支持VLA模型和基础模型的研究。该工作旨在通过降低数据收集门槛,加速通用机器人策略的开发。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-18 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.05945)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
该论文介绍了MobileEgo Anywhere框架,利用智能手机等普通硬件收集超过一小时的自我中心视角数据,以解决现有VLA模型训练数据时长过短的问题。框架包括一个200小时的数据集、一个移动录制应用和一个完整数据处理流程。
答案说明
MobileEgo Anywhere是一个开源框架,旨在利用智能手机等普通硬件采集长时长(超过1小时)的自我中心视角轨迹数据,以支持视觉-语言-动作(VLA)模型的训练。其核心贡献包括发布了一个200小时的数据集、一个移动录制应用和一个数据处理流程。
这篇帖子回答的问题
- MobileEgo Anywhere框架旨在解决什么问题?
核心观点
- MobileEgo Anywhere框架的核心贡献包括发布了一个包含200小时多样化长片段自我中心数据的新型数据集。
FAQ
- Q: MobileEgo Anywhere提供了哪些核心资源?
- A: 根据帖子,该框架的核心资源包括一个200小时的数据集、一个移动录制应用和一个完整的数据处理流程。
关键实体
- MobileEgo Anywhere
- 视觉-语言-动作(VLA)模型