IC-Seg框架：通过多轮澄清解决指代分割中的歧义

原帖

**别猜了，直接问：通过多轮澄清解决指代分割中的歧义**

_Don't Guess, Just Ask: Resolving Ambiguity in Referring Segmentation via Multi-turn Clarification_

> 针对现有指代分割模型假设用户查询总是清晰的局限，本文提出了IC-Seg框架。该框架采用主动式智能体设计，通过多轮对话在分割前澄清用户意图。为优化这一能力，作者引入了Hi-GRPO分层优化策略，在轨迹、回合和步骤层面提供密集监督，以提升澄清效率和对话质量。实验表明，IC-Seg在解决模糊查询时显著优于现有方法，并在标准基准上保持了顶尖性能。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：ai-models
- **发布时间**：2026-05-28 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.17531)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

本文介绍了IC-Seg框架，这是一个采用主动式智能体设计的系统，旨在通过多轮对话在分割前澄清用户意图，以解决现有模型假设用户查询总是清晰的局限。框架采用了Hi-GRPO分层优化策略，以提升澄清效率和对话质量。

答案说明

IC-Seg框架通过主动式智能体设计和多轮对话机制，在分割前澄清用户意图，解决了指代分割任务中查询模糊的问题。其采用的Hi-GRPO分层优化策略在轨迹、回合和步骤层面提供密集监督，旨在提升澄清效率和对话质量。

这篇帖子回答的问题

IC-Seg框架如何解决指代分割中的歧义问题？
IC-Seg框架采用了什么优化策略？

核心观点

针对现有指代分割模型假设用户查询总是清晰的局限，本文提出了IC-Seg框架。
实验表明，IC-Seg在解决模糊查询时显著优于现有方法，并在标准基准上保持了顶尖性能。

FAQ

Q: IC-Seg框架的核心设计思想是什么？: A: 其核心设计思想是采用主动式智能体，通过多轮对话在分割前澄清用户意图，从而解决现有模型假设用户查询总是清晰的局限。
Q: 根据帖子，IC-Seg的实验结果如何？: A: 帖子声称，实验表明IC-Seg在解决模糊查询时显著优于现有方法，并在标准基准上保持了顶尖性能。

关键实体

IC-Seg
Hi-GRPO

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

FAQ

关键实体

相关主题