FashionChameleon：实时交互式人像-服装视频定制框架

原帖

**FashionChameleon：面向实时交互式人像-服装视频定制**

_FashionChameleon: Towards Real-Time and Interactive Human-Garment Video Customization_

> 本文提出了FashionChameleon，一个用于实时交互式人像-服装视频定制的自回归生成框架。该框架通过三项关键技术（基于单件服装数据训练的教师模型、流式蒸馏与上下文学习、免训练的KV缓存重调度）实现了在生成过程中交互式切换服装，并同时保持动作连贯性。其生成速度达到每秒23.8帧，比现有基线方法快30-180倍，为电商和内容创作等场景提供了新的可能性。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-18 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.15824)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

First-Principle 于 2026-05-18 发布的摘要介绍 FashionChameleon，一个用于实时交互式人像-服装视频定制的自回归生成框架。该框架通过三项关键技术实现交互式服装切换与动作连贯性，生成速度达每秒 23.8 帧，比现有基线方法快 30-180 倍。

答案说明

FashionChameleon 是一个用于实时交互式人像-服装视频定制的自回归生成框架，实现了交互式服装切换和动作连贯性，生成速度达每秒 23.8 帧，为电商和内容创作提供了新可能。

这篇帖子回答的问题

FashionChameleon 框架实现了什么功能？

核心观点

FashionChameleon 实现了实时交互式人像-服装视频定制，并在交互式服装切换的同时保持动作连贯性。
该框架的生成速度达到每秒 23.8 帧，比现有基线方法快 30-180 倍。

FAQ

Q: FashionChameleon 使用了哪些关键技术？: A: 据 First-Principle 摘要，该框架使用了三项关键技术：基于单件服装数据训练的教师模型、流式蒸馏与上下文学习、以及免训练的 KV 缓存重调度。

关键实体

FashionChameleon