**推理幻象:通过零链式思维截断揭露大语言模型中规避型数据污染**

_The Illusion of Reasoning: Exposing Evasive Data Contamination in LLMs via Zero-CoT Truncation_

> 该论文针对大语言模型(LLMs)中数据污染问题,指出恶意模型发布者会通过规避性策略(如对基准数据进行改写)来逃避检测并人为提升排行榜表现。现有方法难以可靠检测此类隐蔽污染。研究揭示了一个关键现象:模型生成的推理步骤会主动掩盖其底层记忆行为。基于此,论文提出了Zero-CoT Probe(ZCP)黑盒检测方法,通过故意截断整个链式思维过程来暴露潜在的捷径映射。ZCP通过比较模型在原始基准数据集与同构扰动参考数据集上的零链式思维性能,来隔离记忆与内在问题解决能力。此外,论文引入了'污染置信度'指标,量化污染的可能性和严重程度,超越了简单的二元分类。实验表明ZCP能稳健检测直接和规避型数据污染。代码已开源。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-25 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21856)