解耦通信与策略：带宽受限下的鲁棒多智能体强化学习

原帖

**解耦通信与策略：带宽受限下的鲁棒多智能体强化学习**

_Decoupling Communication from Policy: Robust MARL under Bandwidth Constraints_

> 该论文针对多智能体强化学习（MARL）中通信带宽受限的挑战，提出了两项创新：一是引入标准化的带宽预算指标β，统一了稀疏性、通信轮次和消息维度；二是设计了SLIM架构，将通信路径与策略的潜在表征解耦，从而在限制带宽的同时保持策略能力。实验表明，该方法在部分可观测的MARL基准测试中达到领先水平，即使在带宽有限时也表现出色，性能下降微乎其微。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-26 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.21085)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该论文针对多智能体强化学习（MARL）中通信带宽受限的挑战，提出了两项创新：一是引入标准化的带宽预算指标β，统一了稀疏性、通信轮次和消息维度；二是设计了SLIM架构，将通信路径与策略的潜在表征解耦，从而在限制带宽的同时保持策略能力。实验表明，该方法在部分可观测的MARL基准测试中达到领先水平，即使在带宽有限时也表现出色，性能下降微乎其微。

答案说明

该论文提出了一种解耦通信与策略的MARL方法，通过引入标准化带宽预算指标β和SLIM架构，在带宽受限的条件下实现了鲁棒的多智能体强化学习，并在基准测试中表现出色。

这篇帖子回答的问题

多智能体强化学习（MARL）中通信带宽受限时，如何保持策略能力？
SLIM架构如何实现通信路径与策略潜在表征的解耦？

核心观点

论文引入了标准化的带宽预算指标β，统一了稀疏性、通信轮次和消息维度。
SLIM架构通过解耦通信路径与策略表征，在带宽受限下保持策略性能。

关键实体

SLIM架构
标准化带宽预算指标β
HuggingFace Daily Papers