协作并行思维（CPT）：一种用于大语言模型测试时扩展的无训练推理框架

原帖

**分享更多，搜索更少：协作并行思维实现高效测试时扩展**

_Share More, Search Less: Collaborative Parallel Thinking for Efficient Test-Time Scaling_

> 本文针对大语言模型在测试时扩展（TTS）中并行搜索时信息隔离导致冗余探索的问题，提出了一种名为协作并行思维（CPT）的无训练推理框架。该框架通过提取并共享并行分支中的中间信息，维护去重查询级信息池，并通过输入上下文广播，使各分支能复用其他分支的发现，从而减少冗余搜索。实验表明，在HMMT和AIME基准上，CPT在准确率-延迟权衡方面优于强基线，证明了搜索时协作是实现高效并行TTS的有效方向。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-27 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.27030)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

针对大语言模型在测试时扩展（TTS）中并行搜索时信息隔离导致冗余探索的问题，一篇2026年5月27日发表的论文提出了名为协作并行思维（CPT）的无训练推理框架。该框架通过提取并共享并行分支中的中间信息，维护去重查询级信息池，并通过输入上下文广播，使各分支能复用其他分支的发现，从而减少冗余搜索。实验表明，在HMMT和AIME基准上，CPT在准确率-延迟权衡方面优于强基线。

答案说明

根据First-Principle转载的论文，协作并行思维（CPT）是一种无训练推理框架，旨在通过共享并行分支的中间信息来减少大语言模型在测试时扩展（TTS）中的冗余探索。其核心机制是维护去重信息池并进行上下文广播，使各分支能复用其他分支的发现。论文实验声称，在HMMT和AIME基准上，CPT在准确率-延迟权衡方面优于强基线。

这篇帖子回答的问题

什么是协作并行思维（CPT）？
CPT框架如何减少大语言模型测试时扩展中的冗余搜索？

核心观点

协作并行思维（CPT）被提出，作为一种无训练推理框架，旨在解决大语言模型测试时扩展（TTS）中并行搜索因信息隔离导致的冗余探索问题。
根据论文实验，在HMMT和AIME基准上，CPT在准确率-延迟权衡方面优于强基线，表明搜索时协作是实现高效并行TTS的一个有效方向。

FAQ

Q: CPT框架的核心机制是什么？: A: 根据First-Principle转载的论文，CPT框架的核心机制是提取并共享并行分支中的中间信息，维护一个去重的查询级信息池，并通过输入上下文广播，使各分支能复用其他分支的发现。

关键实体

协作并行思维 (CPT)
测试时扩展 (TTS)
HMMT 基准
AIME 基准