**DiffusionBlocks:逐块训练神经网络**

_DiffusionBlocks: Training Neural Networks One Block at a Time_

> Sakana AI 和东京大学的研究者提出了DiffusionBlocks框架,通过将残差网络划分为独立可训练的块,并利用扩散模型的逆过程来解释块级更新,从而在不牺牲性能的前提下,将训练所需的内存减少B倍(B为块数)。该方法在视觉、图像生成和语言建模等架构上,性能与端到端反向传播相当。这项工作在ICLR 2026上发表,旨在降低大规模AI训练的内存门槛,使AI开发更加普及。

**来源信息**
- **来源**:Hacker News:AI 热帖
- **分类**:论文
- **发布时间**:2026-05-28 15:51(北京时间)
- **原文**:[打开原文](https://pub.sakana.ai/diffusionblocks)