LLM排序

本文提出将配对排名提示（PRP）重新定义为从嘈杂配对比较中进行主动学习的问题。作者指出，传统排序算法假设无噪声且具有传递性，但LLM的配对判断存在噪声、顺序敏感且可能不具传递性。研究引入了一种随机方向预言机，每个配对仅需一次LLM调用，通过将系统性位置偏差转化为零均值噪声，实现了无偏聚合排名。

精选帖子