鲁棒可解释机器学习

该论文提出SAE-FT方法，通过稀疏自编码器对CLIP视觉表示中的语义特征变化进行正则化，防止微调中的灾难性遗忘，实现机械透明且计算高效的可解释微调，在ImageNet及相关基准上达到或超越当时最优性能。

精选帖子