AI性能差距

人工智能分析公司与IBM合作推出了ITBench-AA基准，用于评估AI模型在代理式企业IT任务中的表现。测试结果显示，当前最先进的前沿模型得分低于50%，表明AI在复杂企业IT场景中仍面临挑战。

精选帖子