**实时音乐扩散模型:高效微调和交互式扩散音乐生成器的后训练**

_Live Music Diffusion Models: Efficient Fine-Tuning and Post-Training of Interactive Diffusion Music Generators_

> 该论文提出了一种名为实时音乐扩散模型(LMDMs)的新方法,旨在将音频扩散模型改造为可交互的实时音乐生成系统,并使其能在消费级硬件上运行。研究团队通过关键的块级KV缓存修改,显著提升了推理效率,使其计算复杂度优于现有的离散自回归模型。此外,他们引入了新颖的ARC-Forcing范式,实现了稳定的后训练对齐,减少了误差累积,无需显式的强化学习或奖励模型。该模型已应用于文本条件生成、基于草图的音乐合成和即兴演奏等多个创意领域,并展示了其在现实艺术-人工智能协作中的潜力,例如作为本地运行的“生成延迟”工具,实时转换音乐家的即兴演奏。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22717)