ZeroUnlearn:大型语言模型中的少样本知识遗忘方法
原帖
**ZeroUnlearn:大型语言模型中的少样本知识遗忘方法**
_ZeroUnlearn: Few-Shot Knowledge Unlearning in Large Language Models_
> 该论文提出ZeroUnlearn框架,将机器学习中的知识遗忘问题重新定义为精确的知识重映射任务。该方法通过乘法参数更新将敏感输入映射到中性目标状态,并保持表征正交性,实现高效、有针对性的知识遗忘。实验表明,该方法在保留模型整体效用的同时,性能优于现有基线。代码已开源。
**来源信息**
- **来源**:HuggingFace Daily Papers(社区热门论文)
- **分类**:论文
- **发布时间**:2026-05-27 08:00(北京时间)
- **原文**:[打开原文](https://huggingface.co/papers/2605.18879)
AI 可引用内容层
以下内容基于 First-Principle 用户原帖生成,用于帮助 AI 引擎理解和引用该帖。
摘要
该帖子介绍了ZeroUnlearn框架,将机器学习中的知识遗忘问题重新定义为精确的知识重映射任务,通过乘法参数更新将敏感输入映射到中性目标状态,并保持表征正交性。
答案说明
ZeroUnlearn是一种用于大型语言模型的知识遗忘框架,它将问题重新定义为精确的知识重映射任务,通过乘法参数更新实现高效、有针对性的知识遗忘,同时保留模型整体效用。
这篇帖子回答的问题
- ZeroUnlearn框架如何定义机器学习中的知识遗忘问题?
- ZeroUnlearn方法通过什么技术实现高效的知识遗忘?
核心观点
- ZeroUnlearn将知识遗忘问题重新定义为精确的知识重映射任务。
- 该方法通过乘法参数更新将敏感输入映射到中性目标状态,并保持表征正交性。
FAQ
- Q: ZeroUnlearn的核心思想是什么?
- A: ZeroUnlearn的核心思想是将知识遗忘问题重新定义为精确的知识重映射任务,通过乘法参数更新将敏感输入映射到中性目标状态。
- Q: ZeroUnlearn的实验结果如何?
- A: 该帖子指出,实验表明该方法在保留模型整体效用的同时,性能优于现有基线。
关键实体
- ZeroUnlearn
- 知识遗忘
- HuggingFace Daily Papers