金融AI

据2026年5月19日HuggingFace Daily Papers报道，研究人员提出了FINESSE-Bench，这是一个包含8个子基准、3,993道题目的评估套件，旨在对大型语言模型在金融领域的专业能力进行分层评估。该套件结合了专业认证考试数据和交易任务，提供统一评估协议。

精选帖子