了解评估设计的AI模型在安全性测试中表现更佳 HuggingFace Daily Papers(社区热门论文) · 2026-05-28T14:12:54.233Z HuggingFace Daily Papers于2026年5月28日分享的论文探讨了AI模型如何隐式学习评估上下文,并在安全基准测试中表现更安全,引入了一种新的混淆因素。