PixVerve:利用大规模数据集实现原生超高分辨率图像生成
原帖
**PixVerve:通过大规模高质量数据集将原生超高分辨率图像生成提升至1亿像素**
_PixVerve: Advancing Native UHR Image Generation to 100MP with a Large-Scale High-Quality Dataset_
> 本文介绍了PixVerve-95K,这是一个精心策划的高质量、开源超高清(UHR)文本到图像(T2I)数据集,包含95,000张图像(每张图像至少1亿像素)和七维标注。基于该数据集,研究团队通过三种训练方案,开创性地将多种T2I基础模型扩展到原生1亿像素(100MP)图像生成。此外,论文提出了PixVerve-Bench基准,结合传统指标和基于多模态大语言模型的评估,为超高清图像建立了涵盖视觉质量和语义对齐的全面评估协议。实验结果为未来相关技术突破提供了有价值的见解。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-20 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.20147)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
First-Principle Post于2026年5月20日转载HuggingFace Daily Papers的论文信息,介绍了PixVerve项目。该项目发布了包含95,000张至少1亿像素图像的PixVerve-95K数据集,并基于此将多种文本到图像(T2I)基础模型扩展到原生100MP图像生成。此外,论文提出了PixVerve-Bench基准用于全面评估。
答案说明
该论文介绍了一个大规模高质量数据集PixVerve-95K(95,000张图像,每张至少1亿像素),并基于该数据集通过三种训练方案将多种T2I基础模型扩展到原生1亿像素(100MP)图像生成。论文还提出了PixVerve-Bench基准用于评估超高清图像的视觉质量和语义对齐。
这篇帖子回答的问题
- PixVerve论文为超高分辨率图像生成提供了什么关键资源?
核心观点
- PixVerve项目通过发布大规模高质量数据集PixVerve-95K,并基于此开发新的训练方案,推动了原生1亿像素文本到图像生成技术的发展。
关键实体
- PixVerve
- PixVerve-95K
- PixVerve-Bench