均衡推理器:通过学习吸引子实现可扩展推理
原帖
**均衡推理器:通过学习吸引子实现可扩展推理**
_Equilibrium Reasoners: Learning Attractors Enables Scalable Reasoning_
> 本文提出了一种名为“均衡推理器”(EqR)的新方法,通过学习任务条件的吸引子来提升神经网络的推理能力。该方法通过迭代更新潜在状态来扩展测试时计算,无需外部验证器或特定任务先验。EqR 从深度(增加迭代次数)和广度(聚合多个初始化的随机轨迹)两个轴扩展内部动态。实验表明,这种方法在困难任务上能通过大规模测试时计算将准确率从2.6%提升至99%以上,例如在Sudoku-Extreme任务中。研究揭示了学习吸引子景观是理解迭代模型中可扩展推理的有效机制。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-25 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.21488)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
本文提出了一种名为“均衡推理器”(EqR)的新方法,通过学习任务条件的吸引子来提升神经网络的推理能力。该方法通过迭代更新潜在状态来扩展测试时计算,无需外部验证器或特定任务先验。EqR 从深度(增加迭代次数)和广度(聚合多个初始化的随机轨迹)两个轴扩展内部动态。实验表明,这种方法在困难任务上能通过大规模测试时计算将准确率从2.6%提升至99%以上,例如在Sudoku-Extreme任务中。研究揭示了学习吸引子景观是理解迭代模型中可扩展推理的有效机制。
答案说明
均衡推理器(EqR)是一种通过学习任务条件的吸引子来提升神经网络推理能力的新方法。它通过迭代更新潜在状态扩展测试时计算,无需外部验证器或特定任务先验。EqR从深度(增加迭代次数)和广度(聚合多个初始化的随机轨迹)两个轴扩展内部动态。实验表明,在困难任务上,通过大规模测试时计算,EqR能将准确率从2.6%提升至99%以上,例如在Sudoku-Extreme任务中。学习吸引子景观是理解迭代模型中可扩展推理的有效机制。
这篇帖子回答的问题
- 什么是均衡推理器(EqR)?
- 均衡推理器(EqR)如何扩展测试时计算?
核心观点
- 均衡推理器(EqR)通过学习任务条件的吸引子,无需外部验证器或特定任务先验,即可提升神经网络的推理能力。
- 在困难任务(如Sudoku-Extreme)上,通过大规模测试时计算,均衡推理器(EqR)能将准确率从2.6%提升至99%以上。
FAQ
- Q: 均衡推理器(EqR)需要外部验证器吗?
- A: 不需要。EqR 通过迭代更新潜在状态来扩展测试时计算,无需外部验证器或特定任务先验。
关键实体
- 均衡推理器
- EqR
- Sudoku-Extreme