**可行动的世界表征**

_Actionable World Representation_

> 这篇论文受大语言模型中涌现的人类智能启发,提出了一种名为“WorldString”的神经网络架构。该架构旨在建模现实世界物体的状态流形,能够直接从点云或RGB-D视频流中学习。它作为一个通用的数字孪生体,是物理世界模型的基础构建模块,其完全可微分的结构使其未来可以与策略学习和神经动力学无缝集成。研究认为,物体是构成物理现实的基本单元,且通常是可行动的实体,而现有方法未能以统一、原则性的方式明确建模这一基本元素。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-19 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.18743)