AI助手可被不可听见的声音劫持和操纵

原帖

**AI助手可被不可听见的声音劫持和操纵**

_AI assistants can be hijacked and manipulated by inaudible sounds_

> 一项发表于IEEE S&P 2026的研究揭示，大型音频语言模型（LALMs）存在一种此前被忽视的安全威胁——听觉提示注入。研究者提出了AudioHijack框架，该框架能生成上下文无关且不可感知的对抗性音频，用于劫持LALMs。该方法在13个最先进的LALMs上进行了实验，实现了79%-96%的劫持成功率，并在Mistral AI和Microsoft Azure的商用语音代理上展示了真实世界攻击效果，表明LALMs存在关键安全漏洞，亟需专门防御。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：论文
- **发布时间**：2026-05-23 21:28（北京时间）
- **原文**：[打开原文](https://arxiv.org/abs/2604.14604)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

一篇发表于IEEE S&P 2026的研究揭示，大型音频语言模型（LALMs）面临一种名为‘听觉提示注入’的安全威胁，研究者提出的AudioHijack框架能生成不可感知的对抗性音频，在多个LALMs上实现了79%-96%的高劫持成功率。

答案说明

该研究表明，AI语音助手可被不可听见的声音劫持和操纵，攻击者利用AudioHijack框架生成对抗性音频，能成功控制大型音频语言模型，证明此类系统存在关键安全漏洞。

这篇帖子回答的问题

研究揭示了AI助手面临的哪种安全威胁？
AudioHijack框架的攻击效果如何？

核心观点

一篇发表于IEEE S&P 2026的研究揭示，大型音频语言模型（LALMs）面临一种名为‘听觉提示注入’的安全威胁，研究者提出的AudioHijack框架能生成不可感知的对抗性音频，在多个LALMs上实现了79%-96%的高劫持成功率。

FAQ

Q: 什么是听觉提示注入？: A: 根据帖子所述，听觉提示注入是一种针对大型音频语言模型（LALMs）的安全威胁，攻击者能生成不可感知的对抗性音频来劫持模型。
Q: AudioHijack框架在真实世界中的攻击效果如何？: A: 帖子指出，该框架在Mistral AI和Microsoft Azure的商用语音代理上展示了真实世界攻击效果，证明了漏洞的现实危害性。

关键实体

大型音频语言模型
AudioHijack框架
Mistral AI
Microsoft Azure