ScientistOne：基于证据链的自主研究系统

原帖

**ScientistOne：通过证据链实现人类水平自主研究**

_ScientistOne: Towards Human-Level Autonomous Research via Chain-of-Evidence_

> 该研究提出了一种名为“证据链”（Chain-of-Evidence, CoE）的可验证性框架，并基于此构建了端到端自主研究系统ScientistOne。针对现有自主研究智能体常出现的编造引用、结果不可复现及方法描述与代码不符等问题，CoE要求所有声明必须可追溯至证据来源。实验表明，在5个前沿研究任务和75篇论文中，基线系统普遍存在系统性失败（如编造引用率高达21%），而ScientistOne实现了零编造引用、完美分数验证和最高的方法-代码一致性，并在性能上达到或超越人类专家。该系统还在医学成像、细粒度识别等6个额外任务中表现优异，甚至在基线系统完全失败的任务上取得了突破性成果。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-28 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.26340)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

2026年5月28日，First-Principle转载HuggingFace Daily Papers社区热门论文，介绍ScientistOne自主研究系统。该系统通过‘证据链’框架要求所有声明可追溯，旨在解决编造引用等问题，实现零编造引用和性能超越人类专家。

答案说明

ScientistOne是一个通过证据链实现人类水平自主研究的端到端系统，它要求所有声明必须可追溯至证据来源，从而解决了现有研究智能体编造引用、结果不可复现等问题，并在实验中表现优异。

这篇帖子回答的问题

ScientistOne系统如何解决现有自主研究智能体的编造引用问题？
根据帖子内容，ScientistOne在实验中的主要性能表现如何？

核心观点

ScientistOne系统通过‘证据链’框架实现了零编造引用，并在性能上达到或超越人类专家。
现有自主研究智能体基线系统在实验中普遍存在系统性失败，例如编造引用率高达21%。

FAQ

Q: ScientistOne系统解决了什么问题？: A: 它解决了现有自主研究智能体常出现的编造引用、结果不可复现及方法描述与代码不符等问题。
Q: ‘证据链’（CoE）框架的核心要求是什么？: A: 要求所有声明必须可追溯至证据来源。

关键实体

ScientistOne
证据链 (Chain-of-Evidence, CoE)
HuggingFace Daily Papers