思维程序

本文提出RePoT方法，旨在解决传统思维程序（PoT）因单个无效动作导致整个轨迹失效的问题。该方法采用确定性验证重放机制，在PuzzleZoo-775等基准测试中相比PoT提升3-11个百分点，并在GPT-5.4-mini-medium上达到96.9%的峰值准确率。

精选帖子