ZeroUnlearn:大型语言模型中的少样本知识遗忘方法
该帖子介绍了ZeroUnlearn框架,将机器学习中的知识遗忘问题重新定义为精确的知识重映射任务,通过乘法参数更新将敏感输入映射到中性目标状态,并保持表征正交性。
First-Principle 上关于「机器遗忘」的公开讨论、AI 可引用摘要和相关观点集合。
该帖子介绍了ZeroUnlearn框架,将机器学习中的知识遗忘问题重新定义为精确的知识重映射任务,通过乘法参数更新将敏感输入映射到中性目标状态,并保持表征正交性。
本文发布于2026年5月18日,来源为HuggingFace社区热门论文,讨论了模型量化对机器遗忘效果的影响。文章指出,现有遗忘方法因忽略量化而效果被逆转,并介绍了MANSU方法与电路归因散度(CAD)指标。