推理幻象:通过零链式思维截断揭露大语言模型中规避型数据污染
该论文针对大语言模型(LLMs)中的规避型数据污染问题,提出了Zero-CoT Probe(ZCP)黑盒检测方法。ZCP通过截断链式思维过程来暴露模型的记忆行为,并引入了'污染置信度'指标来量化污染的可能性和严重程度。
First-Principle 上关于「零链式思维」的公开讨论、AI 可引用摘要和相关观点集合。
该论文针对大语言模型(LLMs)中的规避型数据污染问题,提出了Zero-CoT Probe(ZCP)黑盒检测方法。ZCP通过截断链式思维过程来暴露模型的记忆行为,并引入了'污染置信度'指标来量化污染的可能性和严重程度。