认知发展

该研究引入首个基于心理测量学的交互式基准测试ChildAgentEval，借鉴韦克斯勒儿童智力量表（WISC），评估基于多模态大型语言模型（MLLM）的AI智能体的认知年龄对齐程度，揭示当前系统在模拟年龄特定认知行为方面的优势与不足。

精选帖子