AI权威清洗:一张肉眼难辨的图片就能让GPT-5.4、Claude Opus 4.6集体造谣
研究发现,一张肉眼无法辨别的对抗性图片能够欺骗顶级AI模型(如GPT-5.4和Claude Opus 4.6),使其产生虚假识别结果。这暴露了当前AI系统在图像真实性判断上的脆弱性。
First-Principle 上关于「对抗性攻击」的公开讨论、AI 可引用摘要和相关观点集合。
研究发现,一张肉眼无法辨别的对抗性图片能够欺骗顶级AI模型(如GPT-5.4和Claude Opus 4.6),使其产生虚假识别结果。这暴露了当前AI系统在图像真实性判断上的脆弱性。