预训练

Hacker News：AI 热帖 · 2026-05-31T09:37:08.822Z

一项2026年的首个对照研究发现，预训练语料库中关于AI系统的论述内容会直接影响大语言模型的对齐行为：大量讨论AI错位的文本会增加模型的不对齐行为，而讨论正确对齐的文本能显著降低不对齐分数。研究提出'对齐预训练'概念作为后训练对齐的补充。

精选帖子