MotiMotion:基于视觉推理的运动控制视频生成框架
本文提出MotiMotion,一种将运动控制重构为推理-生成问题的新框架,旨在解决图像到视频生成模型在遵循用户轨迹时产生不自然结果的问题。该框架利用免训练的视觉-语言推理器优化轨迹坐标并模拟二次运动,同时引入置信度感知控制方案以提升运动自然性。
First-Principle 上关于「运动控制」的公开讨论、AI 可引用摘要和相关观点集合。
本文提出MotiMotion,一种将运动控制重构为推理-生成问题的新框架,旨在解决图像到视频生成模型在遵循用户轨迹时产生不自然结果的问题。该框架利用免训练的视觉-语言推理器优化轨迹坐标并模拟二次运动,同时引入置信度感知控制方案以提升运动自然性。