**Warp-as-History:仅用一个训练视频实现可泛化的摄像机控制视频生成**

_Warp-as-History: Generalizable Camera-Controlled Video Generation from One Training Video_

> 该论文提出一种名为“Warp-as-History”的新方法,用于摄像机控制视频生成。现有方法通常需要大量带摄像机标注的视频进行后训练,或依赖测试时优化。新方法将摄像机运动引起的图像扭曲转化为“摄像机扭曲伪历史序列”,并将其输入模型的视觉历史通道,同时与目标帧进行位置对齐并过滤无效令牌。该方法无需训练、架构修改或测试时优化,揭示了冻结视频生成模型跟随摄像机轨迹的零样本能力。此外,仅在一个摄像机标注视频上进行轻量级LoRA微调,即可进一步提升该能力并泛化到未见过的视频,改善了摄像机跟随性、视觉质量和运动动态。实验验证了其有效性。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15182)