SceneCode：基于可执行世界程序的可编辑室内场景生成框架

原帖

**SceneCode：基于可执行世界程序的可编辑室内场景生成框架**

_SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects_

> 该研究提出SceneCode框架，通过将自然语言提示编译为可执行的代码驱动室内场景程序，而非静态网格模型，解决了现有方法在物体级可控性和可交互资产生成方面的局限。该框架采用规划-设计-评估循环生成结构化布局，并通过代码合成策略创建可在Blender中执行的部件级程序，经验证后输出为仿真就绪资产。实验表明，可执行世界程序能提升场景生成的提示忠实度，产生网格结构更清晰、包含可动元数据的资产，适用于具身AI、机器人操作等下游任务。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-20 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.19587)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该研究提出SceneCode框架，通过将自然语言提示编译为可执行的代码驱动室内场景程序，而非静态网格模型，解决了现有方法在物体级可控性和可交互资产生成方面的局限。该框架采用规划-设计-评估循环生成结构化布局，并通过代码合成策略创建可在Blender中执行的部件级程序，经验证后输出为仿真就绪资产。

答案说明

SceneCode是一个通过编译自然语言提示生成可执行室内场景程序的框架，它采用规划-设计-评估循环创建可在Blender中执行的部件级程序，最终输出适用于具身AI和机器人操作的仿真就绪资产，相比静态网格模型提升了场景生成的提示忠实度和资产的可交互性。

这篇帖子回答的问题

SceneCode框架如何解决现有室内场景生成方法在物体级可控性方面的局限？
SceneCode生成的资产适用于哪些下游任务？

核心观点

SceneCode框架通过将自然语言提示编译为可执行的代码驱动程序来生成室内场景，解决了静态网格模型在物体级可控性和可交互资产生成方面的局限。
实验表明，可执行世界程序能提升场景生成的提示忠实度，产生网格结构更清晰、包含可动元数据的资产。

FAQ

Q: SceneCode框架的核心创新是什么？: A: SceneCode的核心创新在于将自然语言提示编译为可执行的代码驱动室内场景程序，而非传统的静态网格模型，从而实现了物体级可控性和可交互资产的生成。
Q: SceneCode生成的资产有什么特点？: A: SceneCode生成的资产具有网格结构更清晰、包含可动元数据的特点，并且是仿真就绪的，适用于具身AI和机器人操作等下游任务。

关键实体

SceneCode
Blender