**SmartDirector:基于关键帧控制的电影级视频生成与叙事节奏控制**

_SmartDirector: Keyframe-Conditioned Cinematic Video Generation with Narrative Pacing Control_

> 该论文提出了SmartDirector框架,旨在通过多关键帧来提升视频生成模型的叙事能力。现有方法主要依赖文本提示或首尾帧等稀疏条件信号,难以精确控制叙事结构和时间节奏。SmartDirector支持单镜头生成、多镜头叙事合成和视频扩展等灵活场景,采用两阶段流程:首先Director-Gen根据关键帧生成低分辨率视频,然后Director-SR利用高分辨率关键帧作为语义锚点进行细节恢复。研究团队还构建了从电影中提取单镜头和多镜头序列的数据管道,以支持稳健的多关键帧训练。实验表明,SmartDirector显著优于现有最先进的方法,相关代码将开源。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.27891)