**更多上下文、更大模型,还是道德知识?施瓦茨价值观在政治文本中检测的系统研究**

_More Context, Larger Models, or Moral Knowledge? A Systematic Study of Schwartz Value Detection in Political Texts_

> 本文系统研究了在政治文本中检测施瓦茨价值观的挑战,探讨上下文长度、检索增强生成(RAG)引入的道德知识以及模型规模的影响。研究发现,更多上下文(如全文档输入)能显著提升有监督编码器(如DeBERTa)的性能,但对零样本大语言模型(LLM)的效果不一致;而通过早期融合引入检索到的道德知识则能更一致地提升各种模型的表现。此外,单纯扩大模型规模(从12B到123B)并不能保证性能提升,且简单的早期融合RAG方法优于复杂的晚期融合变体。研究结果强调,在价值观敏感的自然语言处理任务中,应联合评估上下文、知识和模型家族,而非简单依赖更长输入或更大模型。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-22 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.22641)