一种基于因果推理的去偏知识图谱补全方法技术

技术编号：39808653 阅读：25 留言：0更新日期：2023-12-22 02:43

本申请涉及一种基于因果推理的去偏知识图谱补全方法

全部详细技术资料下载

【技术实现步骤摘要】
一种基于因果推理的去偏知识图谱补全方法、装置及介质

[0001]本专利技术涉及知识图谱补全
，尤其是涉及一种基于因果推理的去偏知识图谱补全方法
、
装置及介质
。

技术介绍

[0002]知识图谱被广泛地应用在许多领域，例如推荐系统，问答系统和信息检索等
。
它们是由三元组构成的集合，其中每个三元组的形式为（头实体，关系，尾实体）
。
虽然常用的知识图谱已经包括了许多已知的三元组，但是知识图谱仍然面临着不完全的问题
。
为了补全知识图谱，知识图谱补全模型定义一个打分函数来度量三元组的可能性
。
[0003]现有的知识图谱补全模型的核心是学习数据之间的相关关系，例如实体
、
关系以及三元组的分数之间的相关关系
。
然而世界是由因果关系驱动的而不是相关关系，相关关系也不意味着因果关系
。
例如，我们观察到打伞的人多了，那么可能是下雨了
。
打伞和下雨有很强的相关关系，但我们不能说打伞导致了下雨
。
基于相关关系的知识图谱补全模型受到混杂因子的影响可能面临着数据偏差的问题
。
例如，由于无视知识图谱中的流行度偏差，知识图谱补全模型会倾向于流行度高的实体和关系
。
而如果直接忽略混杂因子可能会导致学习到实体
、
关系和三元组的分数之间的不正确的相关关系
。
[0004]知识图谱中的数据偏差是指...

【技术保护点】

【技术特征摘要】
1.
一种基于因果推理的去偏知识图谱补全方法，其特征在于，所述方法包括以下步骤：构建待优化知识图谱补全模型；将样本三元组输入所述待优化知识图谱补全模型，得到三元组分数；根据所述样本三元组确定所述样本三元组的混杂因子，并结合所述三元组分数和所述混杂因子得到结合结果；以最小化所述结合结果的损失函数为优化目标，对所述待优化知识图谱补全模型进行优化，得到目标知识图谱补全模型；利用所述目标知识图谱补全模型对知识图谱进行补全
。2.
根据权利要求1所述的基于因果推理的去偏知识图谱补全方法，其特征在于，所述样本三元组包括头实体
、
尾实体以及所述头实体与所述尾实体之间的关系；所述样本三元组的混杂因子包括：流行度
、
一致性和曝光度
。3.
根据权利要求1所述的基于因果推理的去偏知识图谱补全方法，其特征在于，根据所述样本三元组确定所述样本三元组的混杂因子，包括：将所述样本三元组所在的数据集表示为三阶二值张量；根据所述三阶二值张量和所述样本三元组确定所述样本三元组的混杂因子
。4.
根据权利要求3所述的基于因果推理的去偏知识图谱补全方法，其特征在于，将所述样本三元组所在的数据集表示为三阶二值张量，包括：若所述样本三元组为数据集中已知真实的样本三元组，则所述三阶二值张量的值为1；若所述样本三元组为数据集中未知的样本三元组，则所述三阶二值张量的值为
0。5.
根据权利要求1所述的基于因果推理的去偏知识图谱补全方法，其特征在于，结合所述三元组分数和所述混杂因子得到结合结果，包括：预设混杂因子权重，通过所述混杂因子权重对所述混杂因子进行加...

【专利技术属性】
技术研发人员：何向南，肖昌义，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人