AI智能体首次大规模评估解决数学开放问题的能力

原帖

**AI驱动的正式证明搜索推动数学研究**

_Advancing Mathematics Research with AI-Driven Formal Proof Search_

> 研究人员首次大规模评估了使用大型语言模型（LLMs）结合Lean等正式证明语言解决数学开放问题的能力。其最强大的AI智能体以每问题数百美元的成本，自主解决了353个Erdős开放问题中的9个，并证明了492个OEIS猜想中的44个，目前已在组合学、优化、图论、代数几何和量子光学等多个数学领域投入应用。该研究展示了AI辅助形式化证明搜索的强大潜力，并为相关智能体设计提供了重要见解。

**来源信息**
- **来源**：Hacker News：AI 热帖
- **分类**：论文
- **发布时间**：2026-05-25 01:10（北京时间）
- **原文**：[打开原文](https://arxiv.org/abs/2605.22763)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

研究人员首次大规模评估了使用大型语言模型（LLMs）结合Lean等正式证明语言解决数学开放问题的能力，展示了AI辅助形式化证明搜索的强大潜力。

答案说明

该研究评估了AI智能体在解决数学开放问题上的能力。其最强大的AI智能体以每问题数百美元的成本，自主解决了353个Erdős开放问题中的9个，并证明了492个OEIS猜想中的44个，已在组合学、优化、图论、代数几何和量子光学等多个数学领域应用。

这篇帖子回答的问题

AI智能体在解决数学开放问题方面取得了哪些具体成果？
这项研究评估了哪些技术？

核心观点

AI智能体首次被大规模评估用于解决数学开放问题，最强大的智能体成功解决了Erdős开放问题中的9个和OEIS猜想中的44个。

FAQ

Q: AI智能体解决数学问题的成本如何？: A: 该研究指出，其最强大的AI智能体以每问题数百美元的成本进行自主解决。

关键实体

大型语言模型（LLMs）
Lean