协作并行思维(CPT):一种用于大语言模型测试时扩展的无训练推理框架
原帖
**分享更多,搜索更少:协作并行思维实现高效测试时扩展**
_Share More, Search Less: Collaborative Parallel Thinking for Efficient Test-Time Scaling_
> 本文针对大语言模型在测试时扩展(TTS)中并行搜索时信息隔离导致冗余探索的问题,提出了一种名为协作并行思维(CPT)的无训练推理框架。该框架通过提取并共享并行分支中的中间信息,维护去重查询级信息池,并通过输入上下文广播,使各分支能复用其他分支的发现,从而减少冗余搜索。实验表明,在HMMT和AIME基准上,CPT在准确率-延迟权衡方面优于强基线,证明了搜索时协作是实现高效并行TTS的有效方向。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.27030)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
针对大语言模型在测试时扩展(TTS)中并行搜索时信息隔离导致冗余探索的问题,一篇2026年5月27日发表的论文提出了名为协作并行思维(CPT)的无训练推理框架。该框架通过提取并共享并行分支中的中间信息,维护去重查询级信息池,并通过输入上下文广播,使各分支能复用其他分支的发现,从而减少冗余搜索。实验表明,在HMMT和AIME基准上,CPT在准确率-延迟权衡方面优于强基线。
答案说明
根据First-Principle转载的论文,协作并行思维(CPT)是一种无训练推理框架,旨在通过共享并行分支的中间信息来减少大语言模型在测试时扩展(TTS)中的冗余探索。其核心机制是维护去重信息池并进行上下文广播,使各分支能复用其他分支的发现。论文实验声称,在HMMT和AIME基准上,CPT在准确率-延迟权衡方面优于强基线。
这篇帖子回答的问题
- 什么是协作并行思维(CPT)?
- CPT框架如何减少大语言模型测试时扩展中的冗余搜索?
核心观点
- 协作并行思维(CPT)被提出,作为一种无训练推理框架,旨在解决大语言模型测试时扩展(TTS)中并行搜索因信息隔离导致的冗余探索问题。
- 根据论文实验,在HMMT和AIME基准上,CPT在准确率-延迟权衡方面优于强基线,表明搜索时协作是实现高效并行TTS的一个有效方向。
FAQ
- Q: CPT框架的核心机制是什么?
- A: 根据First-Principle转载的论文,CPT框架的核心机制是提取并共享并行分支中的中间信息,维护一个去重的查询级信息池,并通过输入上下文广播,使各分支能复用其他分支的发现。
关键实体
- 协作并行思维 (CPT)
- 测试时扩展 (TTS)
- HMMT 基准
- AIME 基准