IC-Seg框架:通过多轮澄清解决指代分割中的歧义
原帖
**别猜了,直接问:通过多轮澄清解决指代分割中的歧义**
_Don't Guess, Just Ask: Resolving Ambiguity in Referring Segmentation via Multi-turn Clarification_
> 针对现有指代分割模型假设用户查询总是清晰的局限,本文提出了IC-Seg框架。该框架采用主动式智能体设计,通过多轮对话在分割前澄清用户意图。为优化这一能力,作者引入了Hi-GRPO分层优化策略,在轨迹、回合和步骤层面提供密集监督,以提升澄清效率和对话质量。实验表明,IC-Seg在解决模糊查询时显著优于现有方法,并在标准基准上保持了顶尖性能。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-28 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.17531)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
本文介绍了IC-Seg框架,这是一个采用主动式智能体设计的系统,旨在通过多轮对话在分割前澄清用户意图,以解决现有模型假设用户查询总是清晰的局限。框架采用了Hi-GRPO分层优化策略,以提升澄清效率和对话质量。
答案说明
IC-Seg框架通过主动式智能体设计和多轮对话机制,在分割前澄清用户意图,解决了指代分割任务中查询模糊的问题。其采用的Hi-GRPO分层优化策略在轨迹、回合和步骤层面提供密集监督,旨在提升澄清效率和对话质量。
这篇帖子回答的问题
- IC-Seg框架如何解决指代分割中的歧义问题?
- IC-Seg框架采用了什么优化策略?
核心观点
- 针对现有指代分割模型假设用户查询总是清晰的局限,本文提出了IC-Seg框架。
- 实验表明,IC-Seg在解决模糊查询时显著优于现有方法,并在标准基准上保持了顶尖性能。
FAQ
- Q: IC-Seg框架的核心设计思想是什么?
- A: 其核心设计思想是采用主动式智能体,通过多轮对话在分割前澄清用户意图,从而解决现有模型假设用户查询总是清晰的局限。
- Q: 根据帖子,IC-Seg的实验结果如何?
- A: 帖子声称,实验表明IC-Seg在解决模糊查询时显著优于现有方法,并在标准基准上保持了顶尖性能。
关键实体
- IC-Seg
- Hi-GRPO