**评估交互式AI智能体的认知年龄对齐**

_Evaluating Cognitive Age Alignment in Interactive AI Agents_

> 该研究针对基于多模态大型语言模型(MLLM)的AI智能体,引入首个基于心理测量学的交互式基准测试ChildAgentEval,以评估AI的认知年龄对齐程度。该基准借鉴韦克斯勒儿童智力量表(WISC),系统比较AI智能体与特定年龄人类发育阶段的推理能力,揭示当前智能体AI系统在模拟年龄特定认知行为方面的优势与不足,强调AI与人类智能之间仍存在显著差距。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-19 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.17894)