**ChildVox:理解和表征儿童声音的语音、音频及大型音频语言模型基准测试**

_ChildVox: A Speech, Audio, and Large Audio-Language Model Benchmark in Understanding and Characterizing Sound across Childhood_

> 介绍ChildVox,这是一个新颖的基准测试,用于表征儿童沟通中的多样化声学信号。它涵盖了从出生到学龄的完整发育轨迹,包括生理声音、非语言发声、规范音节和口语。基准测试整合了17个以儿童为中心的音频和语音数据集中的20多个子任务,支持跨语料库和跨领域的系统比较。评估了包括自监督、面向自动语音识别和大型音频语言模型在内的多种基础模型,结果表明ChildVox为识别儿童广泛的声学信号提供了高性能模型,支持下游应用如评估儿童语言水平和跟踪语音发展。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:ai-models
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.29257)