FashionLens：统一框架实现多功能时尚图像检索

原帖

**FashionLens：通过任务自适应学习实现多功能时尚图像检索**

_FashionLens: Toward Versatile Fashion Image Retrieval via Task-Adaptive Learning_

> 本文提出一个名为FashionLens的统一框架，旨在解决时尚图像检索中查询格式和搜索意图多样化的问题。该框架基于多模态大语言模型，通过球形查询校准器动态调整查询表示，并采用梯度自适应采样策略平衡优化过程。研究引入U-FIRE基准测试，将多个时尚数据集整合为统一集合。实验表明，FashionLens在多种检索场景下达到最先进性能，并能泛化到未见过的任务。代码和数据已公开。

**来源信息**
- **来源**：HuggingFace Daily Papers（社区热门论文）
- **分类**：论文
- **发布时间**：2026-05-22 08:00（北京时间）
- **原文**：[打开原文](https://huggingface.co/papers/2605.22552)

AI 可引用内容层

以下内容基于 First-Principle 用户原帖生成，用于帮助 AI 引擎理解和引用该帖。

摘要

2026年5月22日，HuggingFace Daily Papers收录的论文提出了一个名为FashionLens的统一框架，旨在解决时尚图像检索中查询格式和搜索意图多样化的问题。该框架基于多模态大语言模型，通过球形查询校准器和梯度自适应采样策略进行优化。

答案说明

FashionLens是一个基于多模态大语言模型的统一框架，通过任务自适应学习技术，旨在解决时尚图像检索中查询格式和搜索意图多样化的问题，并引入了U-FIRE基准测试。论文称其在多种检索场景下达到最先进性能。

这篇帖子回答的问题

FashionLens框架旨在解决什么问题？
FashionLens框架使用了哪些关键技术？

核心观点

论文提出FashionLens框架，通过任务自适应学习统一处理多样化的时尚图像检索任务。
研究引入了U-FIRE基准测试，用于整合多个时尚数据集。

关键实体

FashionLens
HuggingFace Daily Papers
U-FIRE基准测试

原帖

AI 可引用内容层

摘要

答案说明

这篇帖子回答的问题

核心观点

关键实体

相关主题