开源AI模型

该研究引入了一个红队测试框架，用于衡量开源大型语言模型（LLM）在政治话题上的表达范围（Overton Window），并量化简单的自然语言越狱技术如何扩大这一范围。研究评估了来自10个模型家族、5个国家的30多个开源LLM，发现其政治表达存在系统性不对称。

精选帖子