**ScientistOne:通过证据链实现人类水平自主研究**

_ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence_

> 该研究提出了一种名为“证据链”(Chain-of-Evidence, CoE)的可验证性框架,并基于此构建了端到端自主研究系统ScientistOne。针对现有自主研究智能体常出现的编造引用、结果不可复现及方法描述与代码不符等问题,CoE要求所有声明必须可追溯至证据来源。实验表明,在5个前沿研究任务和75篇论文中,基线系统普遍存在系统性失败(如编造引用率高达21%),而ScientistOne实现了零编造引用、完美分数验证和最高的方法-代码一致性,并在性能上达到或超越人类专家。该系统还在医学成像、细粒度识别等6个额外任务中表现优异,甚至在基线系统完全失败的任务上取得了突破性成果。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-28 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.26340)