**PhotoFlow:基于智能体的3D虚拟摄影任务**

_PhotoFlow: Agentic 3D Virtual Photography Missions_

> 该研究介绍了PhotoFlow,一个用于闭环相机搜索的智能体系统,包含导演、评审和反思者三个组件。它能在无预选相机位或参考图像的3D场景中,根据语言指令推断合适的拍摄方案、选择相机参数并渲染照片。同时,研究引入了VPhotoBench基准测试集,包含47个开源Blender场景和141个语言条件摄影任务。实验表明,在六轮渲染预算下,PhotoFlow在质量对齐综合评分和成功率上优于其他方法。这是首个将语言条件虚拟摄影在任意Blender场景中实现为可执行智能体任务的工作,展示了以LLM为中心的空间智能体在挑战3D推理和审美选择的场景中能生成高质量照片。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-25 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.23771)