论文揭示大语言模型推理链忠诚度评估指标存在根本缺陷 HuggingFace Daily Papers(社区热门论文) · 2026-05-28T09:10:04.344Z 一篇针对大语言模型推理链的忠诚度评估研究指出,当前常用的忠诚度指标(如置信度、重要性等)可能无法真实反映模型内部计算过程,导致对推理链的信任误判。