**REPOT: 通过检查点修复实现可恢复的思维程序**

_REPOT: Recoverable Program-of-Thought via Checkpoint Repair_

> 本文提出一种名为RePoT(可恢复思维程序)的新方法,旨在解决传统单次思维程序(PoT)在生成行动计划时因单个无效动作导致整个轨迹失效的问题。RePoT采用确定性验证重放机制,逐步检查计划直至首个无效转换,然后利用大语言模型(LLM)从已验证前缀处恢复执行。实验显示,在约14%的PoT失败问题中,RePoT仅需额外一次LLM调用。在PuzzleZoo-775等基准测试中,RePoT相比PoT提升3-11个百分点,在GPT-5.4-mini-medium上达到96.9%的峰值准确率(对比PoT的86.3%)。与同等预算的PoT重试基线相比,RePoT在Gemini模型上表现最佳(提升3.8个百分点)。研究还发现,检查点信息是恢复过程中的关键信号,并提出了自适应RePoT作为初步优化方案。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.30052)