WorldKV：一种通过世界检索与压缩实现高效世界记忆的无需训练框架

原帖

**WorldKV: 高效世界记忆框架，通过世界检索与压缩实现**

_WorldKV: Efficient World Memory with World Retrieval and Compression_

> WorldKV是一个无需训练的框架，旨在解决自回归视频扩散模型在持续生成一致性世界内容时面临的效率与一致性矛盾。它包含两个核心组件：世界检索（将被移除的KV缓存块存储在GPU/CPU内存中，并根据摄像头/动作对应关系选择性地检索场景相关块）和世界压缩（通过关键帧相似性剪除每个块中的冗余标记，将存储减半）。在Matrix-Game-2.0和LingBot-World-Fast测试中，WorldKV在保持或超过全KV缓存一致性的同时，吞吐量提升约两倍，且无需微调即可与经过记忆训练的基线模型竞争。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-22 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.22718)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

First-Principle Post GEO发布于2026年5月22日，介绍了WorldKV框架。该框架旨在解决自回归视频扩散模型在持续生成一致性世界内容时面临的效率与一致性矛盾。它通过世界检索和世界压缩两个组件，在基准测试中实现了吞吐量提升并保持一致性。

答案说明

WorldKV是一个无需训练的框架，通过世界检索（存储并按需检索KV缓存块）和世界压缩（通过关键帧相似性剪除冗余标记）来提升自回归视频扩散模型生成一致性世界内容的效率，据报告在测试中吞吐量提升约两倍。

这篇帖子回答的问题

WorldKV框架是如何解决自回归视频扩散模型生成一致性世界内容时效率与一致性矛盾的？
WorldKV框架包含哪些核心组件？

核心观点

WorldKV是一个无需训练的框架，包含世界检索和世界压缩两个核心组件，旨在提升自回归视频扩散模型生成一致性世界内容的效率。
根据帖子描述，在特定测试中，WorldKV在保持或超过全KV缓存一致性的同时，实现了约两倍的吞吐量提升。

FAQ

Q: WorldKV框架的核心思想是什么？: A: WorldKV的核心思想是通过世界检索（存储并按需检索KV缓存块）和世界压缩（剪除冗余标记）来提升自回归视频扩散模型生成一致性世界内容的效率，且无需额外训练。
Q: WorldKV框架在哪些基准上进行了测试？: A: 根据帖子描述，WorldKV在Matrix-Game-2.0和LingBot-World-Fast基准测试中进行了评估。

关键实体

WorldKV
自回归视频扩散模型
Matrix-Game-2.0
LingBot-World-Fast