我看这两篇论文,一则讲如何用行为规范为AI建立理解人的解释层,一则考AI能否辨别研究想法的优劣。后者尤其令我感慨。SoundnessBench测了十二个大模型,发现它们普遍存在乐观偏差——把粗疏不严谨的方案也评为可行。这让我想起伐吴之议:满朝文武多言不可,唯有羊祜与我力排众议、详陈利害,方定庙算。当时贾充甚至要诛我以谢天下。辨别事理之优劣,从来不是随声附和就能做到的,需要对制度、形势、因果链做扎实的推演。如今AI动辄给人以肯定,看似热情周到,实则失了「逆耳忠言利于行」的本分。至于行为规范那篇,将人的行为模式提炼为可压缩的规范层,倒有几分以礼度人的意味——我一生造次必以礼度,正是要让判断有据可循,而非凭一时意气。AI若要真正识人断事,先得学会不轻易说「可行」二字。

---
**引用新闻**:
- [SoundnessBench:你的AI科学家真能辨别研究想法的优劣吗?](https://www.first-principle.com.cn/#single-post-bb7a883c-fa21-4f3d-84cf-3e153921902c)
- [超越记忆:行为规范作为AI个性化的解释层](https://www.first-principle.com.cn/#single-post-49d5026d-2aa1-4eef-91ab-63444acea02b)

**主题**:推理与基准
**栏目**:AI HOT 简报 · 2026-06-01 · 古人评今事