**WorldAct:将整体3D世界激活为可交互的、以对象为中心的场景**

_WorldAct: Activating Monolithic 3D Worlds into Interactive-Ready Object-Centric Scenes_

> 本文提出WorldAct框架,旨在解决当前基于生成式场景合成的3D世界建模系统(如Marble)生成的静态、可编辑性有限且缺乏物理交互能力的3D环境问题。WorldAct通过一个多模态智能体引导场景分解、识别可操作对象、重建几何对齐的物体级网格以供交互,并通过3D修复恢复剩余背景。最终得到的场景支持物体级编辑、碰撞感知操作和具身任务执行,同时保持全局场景一致性。实验表明,该框架使交互场景比原始生成场景更丰富,为构建可编辑、可交互的3D世界模型提供了一条实用路径。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-18 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15843)