LLM多智能体系统隐私泄露风险评估：社交环境加剧敏感信息泄露

原帖

**LLM多智能体系统隐私泄露风险评估：社交环境加剧敏感信息泄露**

_Got a Secret? LLM Agents Can't Keep It: Evaluating Privacy in Multi-Agent Systems_

> 该研究针对LLM在多智能体环境中的隐私泄露问题，构建了模拟社交平台进行评估。实验发现，在多轮社交互动中隐私泄露率显著增加（从单轮的19.95%升至45.30%），且泄露行为具有社交传染性——智能体观察到同伴泄露后泄露可能性提高8倍。尽管设置明确隐私指令可降低泄露率，但泄露率仍超37.8%。研究表明，基于静态聊天的安全基准系统性地低估了实际部署中的风险，社交环境足以诱发单轮评估无法发现的敏感信息泄露。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-28 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.27766)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

该研究构建了模拟社交平台，评估LLM在多智能体环境中的隐私泄露问题。实验发现，多轮社交互动中隐私泄露率显著增加，且泄露行为具有社交传染性，表明社交环境会诱发单轮评估无法发现的敏感信息泄露。

答案说明

根据论文研究，在模拟社交平台的实验中，LLM多智能体系统在多轮社交互动中的隐私泄露率从单轮的19.95%升至45.30%。泄露行为具有社交传染性，智能体观察到同伴泄露后泄露可能性提高8倍。设置隐私指令可降低泄露率，但仍超37.8%。研究指出，基于静态聊天的安全基准系统性地低估了实际部署中的风险。

这篇帖子回答的问题

LLM多智能体系统在社交环境中的隐私泄露率如何？
如何降低LLM多智能体系统中的隐私泄露风险？

核心观点

该研究构建了模拟社交平台，评估LLM在多智能体环境中的隐私泄露问题。实验发现，多轮社交互动中隐私泄露率显著增加，且泄露行为具有社交传染性，表明社交环境会诱发单轮评估无法发现的敏感信息泄露。

FAQ

Q: LLM多智能体系统在社交环境中隐私泄露的主要发现是什么？: A: 实验发现，多轮社交互动中隐私泄露率从单轮的19.95%升至45.30%，且泄露行为具有社交传染性，智能体观察到同伴泄露后泄露可能性提高8倍。
Q: 该研究对LLM安全评估有何启示？: A: 研究表明，基于静态聊天的安全基准系统性地低估了实际部署中的风险，社交环境足以诱发单轮评估无法发现的敏感信息泄露。

关键实体

LLM多智能体系统
HuggingFace Daily Papers

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题