DrawMotion：基于手绘草图与扩散模型的3D人体动作生成框架

原帖

**DrawMotion: 通过手绘草图生成3D人体动作**

_DrawMotion: Generating 3D Human Motions by Freehand Drawing_

> 本文介绍了DrawMotion，一个基于扩散模型的高效框架，旨在解决文本到动作生成中用户难以通过文字精确描述动作的问题。该框架通过结合传统文本条件和新颖的手绘草图条件，分别提供语义和空间控制，实现细粒度动作生成。具体创新包括：1）开发算法自动生成不同数据集格式的手绘火柴人草图；2）提出多条件模块（MCM）集成到扩散过程中，降低计算复杂度；3）利用MCM中间特征的连续空间特性，实现训练自由引导，确保生成动作与用户意图对齐。实验表明，手绘方法可减少用户生成想象动作的时间约46.7%。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-21 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.20955)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

本文介绍了DrawMotion框架，该框架结合文本与手绘草图条件，通过扩散模型实现细粒度3D人体动作生成。其核心创新包括自动生成草图的算法、多条件模块（MCM）以及训练自由引导。据论文称，该方法可将用户生成想象动作的时间减少约46.7%。

答案说明

DrawMotion是一个扩散模型框架，它允许用户通过手绘草图（提供空间控制）和文本描述（提供语义控制）来生成3D人体动作，旨在解决纯文本描述动作不精确的问题。论文提到其核心创新是多条件模块（MCM）和自动生成火柴人草图的算法。

这篇帖子回答的问题

DrawMotion框架如何解决文本描述3D人体动作不精确的问题？
根据论文，使用手绘草图方法相比纯文本生成动作能节省多少时间？

核心观点

DrawMotion框架的核心是结合文本（语义）和手绘草图（空间）两种条件来生成更精确的3D人体动作。
据论文实验，采用手绘草图条件的方法能将用户生成想象动作所需时间减少约46.7%。

FAQ

Q: DrawMotion框架的主要应用场景是什么？: A: 根据论文描述，其主要应用于3D人体动作生成，旨在帮助用户通过更直观的方式（如草图）来指定动作细节。
Q: 论文中提到的“训练自由引导”是什么？: A: 根据论文介绍，这是指利用MCM中间特征的连续空间特性，在不额外训练的情况下引导生成过程，以确保生成的动作与用户意图对齐。

关键实体

DrawMotion
扩散模型
多条件模块（MCM）

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题