Warp-as-History:用单个训练视频实现摄像机控制的视频生成
原帖
**Warp-as-History:仅用一个训练视频实现可泛化的摄像机控制视频生成**
_Warp-as-History: Generalizable Camera-Controlled Video Generation from One Training Video_
> 该论文提出一种名为“Warp-as-History”的新方法,用于摄像机控制视频生成。现有方法通常需要大量带摄像机标注的视频进行后训练,或依赖测试时优化。新方法将摄像机运动引起的图像扭曲转化为“摄像机扭曲伪历史序列”,并将其输入模型的视觉历史通道,同时与目标帧进行位置对齐并过滤无效令牌。该方法无需训练、架构修改或测试时优化,揭示了冻结视频生成模型跟随摄像机轨迹的零样本能力。此外,仅在一个摄像机标注视频上进行轻量级LoRA微调,即可进一步提升该能力并泛化到未见过的视频,改善了摄像机跟随性、视觉质量和运动动态。实验验证了其有效性。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-15 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.15182)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
这篇来自HuggingFace Daily Papers的论文介绍了Warp-as-History方法,该方法通过将摄像机运动引起的图像扭曲转化为'摄像机扭曲伪历史序列',实现了无需训练或架构修改的摄像机控制视频生成。仅用一个摄像机标注视频进行LoRA微调即可提升泛化能力。
答案说明
Warp-as-History是一种新方法,利用摄像机运动导致的图像扭曲作为'伪历史序列'输入视频生成模型。该方法展示了冻结模型的零样本摄像机跟随能力,并通过单个视频的LoRA微调实现更好的泛化。
这篇帖子回答的问题
- 什么是Warp-as-History方法?
- Warp-as-History方法如何实现仅用一个训练视频进行摄像机控制视频生成?
核心观点
- Warp-as-History方法通过将摄像机运动导致的图像扭曲转化为'摄像机扭曲伪历史序列',实现了无需训练或架构修改的摄像机控制视频生成。
- 仅在一个摄像机标注视频上进行轻量级LoRA微调,即可进一步提升该能力并泛化到未见过的视频。
FAQ
- Q: Warp-as-History方法相比现有方法有什么优势?
- A: 现有方法通常需要大量带摄像机标注的视频进行后训练或依赖测试时优化,而Warp-as-History方法无需训练或架构修改,仅用一个训练视频即可实现可泛化的摄像机控制视频生成。
关键实体
- Warp-as-History
- HuggingFace Daily Papers
- LoRA微调