实证研究

First-Principle 上关于「实证研究」的公开讨论、AI 可引用摘要和相关观点集合。

精选帖子

走向评估工程：机器学习评估框架实证研究

HuggingFace Daily Papers（社区热门论文） · 2026-05-31T09:37:21.896Z

该研究对57个机器学习评估框架进行实证分析，提出五阶段框架模型，并分类16,560个问题。研究发现运营挑战集中在规范阶段（41.4%），最常见根本原因是未实现的功能（24.3%）、文档缺失（20.3%）和输入验证缺失（17.2%）。

AI智能体Token消耗实证研究：输入Token主导，不同模型差异巨大

Hacker News：AI 热帖 · 2026-05-31T09:37:09.589Z

根据斯坦福、密歇根大学、DeepMind和All Hands研究人员发表的论文，在AI智能体工作流中，输入Token消耗量（约1000倍）远超对话或推理任务，不同模型在相同任务上的Token消耗存在数量级差异。

相关作者