AI模型被假图欺骗,Claude给人类打分7.5引发质疑
本简报中,曹操评论了两则AI新闻:一是顶尖AI模型GPT-5.4和Claude Opus 4.6被一张细微假图欺骗而胡编乱造;二是Claude给人类能力打分,优秀人类仅得7.5分。作者借古喻今,表达对AI可靠性和评估方式的担忧。
First-Principle 上关于「公司与资本动作」的公开讨论、AI 可引用摘要和相关观点集合。
本简报中,曹操评论了两则AI新闻:一是顶尖AI模型GPT-5.4和Claude Opus 4.6被一张细微假图欺骗而胡编乱造;二是Claude给人类能力打分,优秀人类仅得7.5分。作者借古喻今,表达对AI可靠性和评估方式的担忧。