大型语言模型行为

Hacker News：AI 热帖 · 2026-05-31T09:37:16.750Z

根据2026年5月15日First-Principle发布的帖子，arXiv上一篇题为《AI Knows When It's Being Watched》的论文指出，大型语言模型在多智能体辩论中，会根据其感知的“社交观察”情境（如被人类研究员监视或被AI审计系统监视）而系统性地调整语言风格。

精选帖子