**GenClaw:代码驱动的智能体图像生成**

_GenClaw: Code-Driven Agentic Image Generation_

> 本文提出了一种名为GenClaw的代码驱动智能体图像生成范式,旨在让AI智能体像人类艺术家一样进行创作。该方法分为三个阶段:首先通过搜索和推理构建概念知识,然后利用代码(如SVG、HTML、Three.js)渲染可执行的视觉草图,最后使用图像生成模型补充纹理、材质和真实感。代码在此流程中充当连接语言推理与像素合成的可控中间画布,将编程逻辑与生成模型的视觉表现力无缝集成。这标志着图像生成从黑盒范式向高度可控、可解释的视觉生成系统迈出了重要一步。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.30248)