三重块扩散RWKV模型：统一因果与扩散架构，实现1.6倍解码加速

原帖

**三重块扩散RWKV模型：统一因果与扩散架构，实现1.6倍解码加速**

_Triplet-Block Diffusion RWKV_

> 本文提出B^3D-RWKV模型，通过三重块布局方法，将RWKV的线性时间因果推理效率与双向离散扩散相结合，解决了因果Transformer的顺序解码和二次注意力成本问题。该模型在8项任务上达到现有模型相当精度，解码吞吐量平均提升1.6倍。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-28 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.25969)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

根据2026年5月28日来自HuggingFace Daily Papers的热门论文，B^3D-RWKV模型通过三重块布局方法，将RWKV的线性时间因果推理效率与双向离散扩散相结合，解决了因果Transformer的顺序解码和二次注意力成本问题，平均解码吞吐量提升1.6倍。

答案说明

该论文提出了B^3D-RWKV模型，通过结合RWKV的线性效率和双向离散扩散，解决了传统因果Transformer的解码瓶颈，在8项任务上达到相当精度，平均解码吞吐量提升1.6倍。

这篇帖子回答的问题

B^3D-RWKV模型解决了什么核心问题？
三重块扩散RWKV模型相比传统因果Transformer有什么性能提升？

核心观点

B^3D-RWKV模型通过三重块布局方法，统一了RWKV的线性因果推理效率与双向离散扩散，解决了传统因果Transformer的顺序解码和二次注意力成本问题。
该模型在8项任务上达到现有模型相当精度，解码吞吐量平均提升1.6倍。

关键实体

B^3D-RWKV
RWKV
因果Transformer
HuggingFace Daily Papers