**FashionLens:通过任务自适应学习实现多功能时尚图像检索**

_FashionLens: Toward Versatile Fashion Image Retrieval via Task-Adaptive Learning_

> 本文提出一个名为FashionLens的统一框架,旨在解决时尚图像检索中查询格式和搜索意图多样化的问题。该框架基于多模态大语言模型,通过球形查询校准器动态调整查询表示,并采用梯度自适应采样策略平衡优化过程。研究引入U-FIRE基准测试,将多个时尚数据集整合为统一集合。实验表明,FashionLens在多种检索场景下达到最先进性能,并能泛化到未见过的任务。代码和数据已公开。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22552)