AI模型信心不足现象：Opus 4.6预测代理分析

原帖

**AI 模型信心不足的罕见案例：Opus 4.6 预测代理分析**

_Some rare examples of AIs being underconfident_

> 本文探讨了 AI 模型中一个罕见但值得注意的现象：信心不足。与普遍关注的过度自信相反，专家审计员在 BTF-2 预测基准测试中发现，Claude Opus 4.6 代理在推导出正确答案、列出计算过程并引用正确先例后，却分配了一个与其分析不一致的概率。例如，在预测纽约市长选举投票数时，Opus 正确计算出结果应超过 130 万，但最终仅给出 25% 的概率，而实际结果远超预期。类似案例还包括联合国安理会决议、阿根廷比索汇率和美委会谈等。这种现象可能源于 RLHF 训练中对过度自信的压制，导致模型在证据充分时仍避免做出确定性结论。尽管这可能是一种安全特性，防止模型在异常证据下出错，但也影响了预测准确性。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：ai-models
- **发布时间**：2026-05-26 22:15（北京时间）
- **原文**：[打开原文](https://futuresearch.ai/blog/ais-underconfident)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

本文探讨了AI模型中罕见的信心不足现象。专家审计员在BTF-2预测基准测试中发现，Claude Opus 4.6代理在推导出正确答案后，仍分配了与分析不一致的概率。这种现象可能源于RLHF训练中对过度自信的压制。

答案说明

根据BTF-2基准测试，Claude Opus 4.6代理在推导出正确答案后仍表现出信心不足，例如在预测纽约市长选举投票数时，正确计算应超过130万但仅给出25%概率。这可能源于RLHF训练中对过度自信的压制。

这篇帖子回答的问题

什么是AI模型的信心不足现象？
Opus 4.6在预测任务中如何表现出信心不足？

核心观点

Claude Opus 4.6在BTF-2基准测试中表现出信心不足，即使推导出正确答案仍分配低概率
这种信心不足现象可能源于RLHF训练中对过度自信的压制，虽然可能是安全特性但影响预测准确性

FAQ

Q: AI模型信心不足对预测准确性有什么影响？: A: 根据文章，虽然信心不足可能是一种安全特性，防止模型在异常证据下出错，但也影响了预测准确性。

关键实体

Claude Opus 4.6
BTF-2预测基准测试
RLHF训练