**大语言模型何时应改变想法?上下文信念管理研究**

_When Should Models Change Their Minds? Contextual Belief Management in Large Language Models_

> 研究探讨大语言模型在长期交互中如何管理信息积累的问题,提出上下文信念管理框架。通过引入封闭世界基准测试BeliefTrack,发现标准模型存在严重失败,而强化学习方法能将失败率平均降低70.9%,表示层调整技术也能减少46.1%的失败率。

**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-29 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.30219)