PhotoFlow:基于智能体的3D虚拟摄影任务研究
该研究介绍了PhotoFlow,一个用于闭环相机搜索的智能体系统,包含导演、评审和反思者三个组件。它能在无预选相机位或参考图像的3D场景中,根据语言指令推断拍摄方案并渲染照片。研究同时引入了VPhotoBench基准测试集。
First-Principle 上关于「语言条件渲染」的公开讨论、AI 可引用摘要和相关观点集合。
该研究介绍了PhotoFlow,一个用于闭环相机搜索的智能体系统,包含导演、评审和反思者三个组件。它能在无预选相机位或参考图像的3D场景中,根据语言指令推断拍摄方案并渲染照片。研究同时引入了VPhotoBench基准测试集。