Revisiting Catastrophic Forgetting in Continual Knowledge图谱嵌入¶
论文基本信息¶
- 作者: Gerard Pons, Carlos Escolano, Besim Bilalli, Anna Queralt
- arXiv: https://arxiv.org/abs/2604.19401
- 领域: cs.LG, cs.AI
摘要¶
知识图谱嵌入(KGE)支持多种下游任务,但实际中知识图谱会随新实体和事实的加入而演化,催生了持续知识图谱嵌入(CKGE)方法。现有 CKGE 方法主要通过限制已有嵌入的改变来处理灾难性遗忘(之前学习任务的性能下降)。但论文证明这一观点不完整。当新实体引入时,其嵌入可能干扰已有嵌入,导致模型在应该是先前正确答案的位置预测新实体。这种"实体干扰"现象在很大程度上被忽视,现有的 CKGE 评估协议也没有考虑。忽视这一效应可能导致性能高估高达 25%。
核心贡献¶
- Entity Interference 现象: 首次识别和系统分析实体干扰问题
- Corrected CKGE Evaluation: 提出考虑实体干扰的修正评估协议
- 25% Performance Overestimation: 证明现有方法因忽视实体干扰导致高达 25% 的性能高估
- CKGE-specific Forgetting Metric: 提出针对 CKGE 的遗忘度量
- Method × Interference Analysis: 分析不同 CKGE 方法和 KGE 模型受不同遗忘来源影响的程度
研究背景与问题¶
CKGE 方法主要关注参数(嵌入向量)的改变,但忽视了新实体引入对已有预测的干扰。现有评估只看旧任务的绝对性能,不考虑模型是否开始错误地预测新实体。
核心方法¶
- Entity Interference 定义: 新实体嵌入干扰已有预测的现象
- Counterfactual Evaluation: 反事实评估——如果新实体不存在,模型会怎么预测
- Forgetting Metric: 区分"遗忘已有知识"和"被新实体干扰"两种不同的性能下降
- Benchmark Correction: 在多个基准上应用修正评估协议
为什么重要¶
该研究对 CKGE 领域有重要影响,揭示了当前评估实践的系统性偏差。对基于知识图谱记忆的 Agent 系统,这意味着需要更全面的遗忘评估。
与移动端/端侧相关性¶
- 端侧知识图谱: 移动端知识图谱需要持续更新,理解遗忘来源至关重要
- 实体干扰的现实影响: 在资源受限设备上,干扰检测可能比完整重训练更高效
- 知识一致性: 实体干扰会损害知识图谱记忆的可靠性