一种知识图谱对齐方法及相关装置制造方法及图纸

技术编号:39304135 阅读:11 留言:0更新日期:2023-11-12 15:53
本申请提供了一种知识图谱对齐方法以及相关装置。本申请实施例可应用于自然语言处理技术领域。其方法包括:首先,获取包括目标节点、m个第一节点及m个关系信息的第一知识图谱和包括n个第二节点的第二知识图谱;其次,对目标节点、m个第一节点、m个关系信息以及n个第二节点进行编码处理,生成目标特征向量、第一节点拼接向量、关系信息拼接向量以及n个第二节点特征,接着,根据目标特征向量、第一节点拼接向量及关系信息拼接向量生成目标融合特征,然后,计算目标融合特征和n个第二节点特征的相似度值,最后根据相似度值确定目标节点在第二知识图谱中的对齐节点。本申请提供的知识图谱对齐方法提高知识图谱中节点对齐的准确性。对齐方法提高知识图谱中节点对齐的准确性。对齐方法提高知识图谱中节点对齐的准确性。

【技术实现步骤摘要】
一种知识图谱对齐方法及相关装置


[0001]本申请涉及自然语言处理
,尤其涉及一种知识图谱对齐方法及相关装置。

技术介绍

[0002]随着人工智能技术中自然语言处理领域的不断发展,知识图谱技术在知识问答、知识推理以及知识检索等场景下发挥着重要作用。知识图谱存储了丰富的结构化知识,通过知识图谱中的节点以及连接节点之间的边表达了真实世界中实体之间多元化关系。由于图谱的不完备性以及异构化,需要对多个知识图谱中节点表示的实体进行对齐,判断多个不同的知识图谱的节点是否指向真实世界中的同一个实体对象,通过知识图谱对齐将多个知识图谱融合成规模更大,信息更丰富的知识图谱。
[0003]目前的知识图谱对齐方法基于一些先验知识或者假设寻找实体对齐的依据或者关键线索,将多个知识图谱中节点表示的实体进行对齐时存在准确性较低的问题。

技术实现思路

[0004]本申请实施例提供了一种知识图谱对齐方法以及相关装置,根据第一知识图谱中的目标节点、与目标节点具有关联关系的第一节点以及目标节点与第一节点的关系信息,得到目标节点对应的目标融合特征,根据第二知识图谱中第二节点对应的第二节点特征与目标融合特征的相似度,确定第二知识图谱中的对齐节点,提高知识图谱中节点表示的实体进行对齐的准确性。
[0005]本申请的一方面提供一种知识图谱对齐方法,包括:
[0006]获取第一知识图谱及第二知识图谱,其中,第一知识图谱包括目标节点、m个第一节点及m个关系信息,每个关系信息用于表征目标节点与每个第一节点的关联关系,第二知识图谱包括n个第二节点,节点表示实体信息,目标节点与m个第一节点表示不同的实体信息,n≥1,m≥1;
[0007]通过知识图谱对齐模型对目标节点、m个第一节点及m个关系信息进行编码,得到目标特征向量、第一节点拼接向量及关系信息拼接向量;
[0008]将目标特征向量、第一节点拼接向量及关系信息拼接向量进行特征融合,得到目标融合特征;
[0009]通过知识图谱对齐模型对n个第二节点进行编码,得到n个第二节点特征;
[0010]根据目标融合特征及n个第二节点特征,计算得到目标融合特征与n个第二节点特征的n个相似度值;
[0011]根据n个相似度值,确定目标节点在第二知识图谱中的对齐节点,其中,对齐节点的表示的实体信息与目标节点表示的实体信息相同。
[0012]本申请的另一方面提供了一种知识图谱对齐装置,包括:
[0013]知识图谱获取模块,用于获取第一知识图谱及第二知识图谱,其中,第一知识图谱
包括目标节点、m个第一节点及m个关系信息,每个关系信息用于表征目标节点与每个第一节点的关联关系,第二知识图谱包括n个第二节点,节点表示实体信息,目标节点与m个第一节点表示不同的实体信息,n≥1,m≥1;
[0014]第一编码模块,用于通过知识图谱对齐模型对目标节点、m个第一节点及m个关系信息进行编码,得到目标特征向量、第一节点拼接向量及关系信息拼接向量;
[0015]融合模块,用于将目标特征向量、第一节点拼接向量及关系信息拼接向量进行特征融合,得到目标融合特征;
[0016]第二编码模块,用于通过知识图谱对齐模型对n个第二节点进行编码,得到n个第二节点特征;
[0017]相似度值计算模块,用于根据目标融合特征及n个第二节点特征,计算得到目标融合特征与n个第二节点特征的n个相似度值;
[0018]对齐节点确定模块,用于根据n个相似度值,确定目标节点在第二知识图谱中的对齐节点,其中,对齐节点的表示的实体信息与目标节点表示的实体信息相同。
[0019]在本申请实施例的另一种实现方式中,第一编码模块,还用于:
[0020]将目标节点及m个第一节点作为知识图谱对齐模型中节点特征提取层的输入,通过节点特征提取层输出目标特征向量及m个第一节点特征;
[0021]对m个第一节点特征进行向量拼接,生成第一节点拼接向量;
[0022]将m个关系信息作为知识图谱对齐模型中关系特征提取层的输入,通过关系特征提取层输出m个关系特征;
[0023]对m个关系特征进行向量拼接,生成关系信息拼接向量。
[0024]在本申请实施例的另一种实现方式中,第二编码模块,还用于将n个第二节点作为知识图谱对齐模型中节点特征提取层的输入,通过节点特征提取层输出n个第二节点特征。
[0025]在本申请实施例的另一种实现方式中,知识图谱获取模块,还用于:
[0026]获取目标业务,其中,目标业务携带目标实体;
[0027]根据目标实体,获取第一知识图谱;
[0028]从第一知识图谱中确定目标实体对应的目标节点;
[0029]根据第一知识图谱,确定与目标节点具有连边的m个第一节点,其中,连边反应目标节点与每个第一节点的关联关系。
[0030]在本申请实施例的另一种实现方式中,相似度值计算模块,还用于计算目标融合特征与n个第二节点特征的n个余弦相似度,得到n个相似度值。
[0031]本申请的另一方面提供了一种知识图谱对齐模型训练方法,包括:
[0032]获取第一训练知识图谱及第二训练知识图谱,其中,第一训练知识图谱包括训练节点、M个第一训练节点及M个训练关系信息,每个训练关系信息用于表征训练节点与每个第一训练节点的关联关系,第二训练知识图谱包括N个第二训练节点,训练节点表示实体信息,训练节点与M个第一训练节点表示不同的实体信息,N≥1,M≥1;
[0033]通过知识图谱对齐模型对训练节点、M个第一训练节点及M个训练关系信息进行编码,得到训练特征向量、第一训练节点拼接向量及训练关系信息拼接向量;
[0034]将训练特征向量、第一训练节点拼接向量及训练关系信息拼接向量进行特征融合,得到训练融合特征;
[0035]通过知识图谱对齐模型对N个第二训练节点进行编码,得到N个第二训练节点特征;
[0036]根据训练融合特征及N个第二训练节点特征,计算训练融合特征与N个第二训练节点特征的N个相似度值;
[0037]根据N个相似度值,确定训练节点在第二训练知识图谱中的对齐节点及K个负样本节点,其中,对齐节点对应的相似度值大于负样本节点对应的相似度值,K<N;
[0038]根据训练节点、对齐节点及K个负样本节点,对知识图谱对齐模型的参数进行优化,以生成优化后的知识图谱对齐模型,其中,对齐节点携带正样本标签,K个负样本节点携带K个负样本标签。
[0039]本申请的另一方面提供了一种知识图谱对齐模型训练装置,包括:
[0040]训练知识图谱获取模块,用于获取第一训练知识图谱及第二训练知识图谱,其中,第一训练知识图谱包括训练节点、M个第一训练节点及M个训练关系信息,每个训练关系信息用于表征训练节点与每个第一训练节点的关联关系,第二训练知识图谱包括N个第二训练节点,训练节点表示实体信息,训练节点与M个第一训练节点表示不同的实体信息,N≥1,M≥1;...

【技术保护点】

【技术特征摘要】
1.一种知识图谱对齐方法,其特征在于,包括:获取第一知识图谱及第二知识图谱,其中,所述第一知识图谱包括目标节点、m个第一节点及m个关系信息,每个所述关系信息用于表征所述目标节点与每个所述第一节点的关联关系,所述第二知识图谱包括n个第二节点,所述节点表示实体信息,所述目标节点与所述m个第一节点表示不同的实体信息,n≥1,m≥1;通过知识图谱对齐模型对所述目标节点、所述m个第一节点及所述m个关系信息进行编码,得到目标特征向量、第一节点拼接向量及关系信息拼接向量;将所述目标特征向量、所述第一节点拼接向量及所述关系信息拼接向量进行特征融合,得到目标融合特征;通过所述知识图谱对齐模型对所述n个第二节点进行编码,得到n个第二节点特征;根据所述目标融合特征及n个所述第二节点特征,计算得到所述目标融合特征与n个所述第二节点特征的n个相似度值;根据所述n个相似度值,确定所述目标节点在所述第二知识图谱中的对齐节点,其中,所述对齐节点的表示的实体信息与所述目标节点表示的实体信息相同。2.如权利要求1所述的知识图谱对齐方法,其特征在于,所述通过知识图谱对齐模型对所述目标节点、所述m个第一节点及所述m个关系信息进行编码,得到目标特征向量、第一节点拼接向量及关系信息拼接向量,包括:将所述目标节点及所述m个第一节点作为知识图谱对齐模型中节点特征提取层的输入,通过所述节点特征提取层输出所述目标特征向量及m个第一节点特征;对所述m个第一节点特征进行向量拼接,生成所述第一节点拼接向量;将所述m个关系信息作为所述知识图谱对齐模型中关系特征提取层的输入,通过所述关系特征提取层输出m个关系特征;对所述m个关系特征进行向量拼接,生成所述关系信息拼接向量。3.如权利要求1所述的知识图谱对齐方法,其特征在于,所述通过所述知识图谱对齐模型对所述n个第二节点进行编码,得到n个第二节点特征,包括:将所述n个第二节点作为所述知识图谱对齐模型中节点特征提取层的输入,通过所述节点特征提取层输出n个第二节点特征。4.如权利要求1所述的知识图谱对齐方法,其特征在于,所述获取第一知识图谱,包括:获取目标业务,其中,所述目标业务携带目标实体;根据所述目标实体,获取第一知识图谱;从所述第一知识图谱中确定所述目标实体对应的所述目标节点;根据所述第一知识图谱,确定与所述目标节点具有连边的m个第一节点,其中,所述连边反应所述目标节点与每个所述第一节点的关联关系。5.如权利要求1所述的知识图谱对齐方法,其特征在于,所述根据所述目标融合特征及n个所述第二节点特征,计算得到所述目标融合特征与n个所述第二节点特征的n个相似度值,包括:计算所述目标融合特征与n个所述第二节点特征的n个余弦相似度,得到n个相似度值。6.一种知识图谱对齐模型训练方法,其特征在于,包括:获取第一训练知识图谱及第二训练知识图谱,其中,所述第一训练知识图谱包括训练
节点、M个第一训练节点及M个训练关系信息,每个所述训练关系信息用于表征所述训练节点与每个所述第一训练节点的关联关系,所述第二训练知识图谱包括N个第二训练节点,所述训练节点表示实体信息,所述训练节点与所述M个第一训练节点表示不同的实体信息,N≥1,M≥1;通过知识图谱对齐模型对所述训练节点、所述M个第一训练节点及所述M个训练关系信息进行编码,得到训练特征向量、第一训练节点拼接向量及训练关系信息拼接向量;将所述训练特征向量、所述第一训练节点拼接向量及所述训练关系信息拼接向量进行特征融合,得到训练融合特征;通过所述知识图谱对齐模型对所述N个第二训练节点进行编码,得到N个第二训练节点特征;根据所述训练融合特征及N个第二训练节点特征,计算所述训练融合特征与所述N个第二训练节点特征的N个相似度值;根据所述N个相似度值,确定所述训练节点在所述第二训练知识图谱中的对齐节点及K个负样本节点,其中,所述对齐节点对应的相似度值大于所述负样本节点对应的相似度值,K<N;根据所述训练节点、所述对齐节点及所述K个负样本节点,对所述知识图谱对齐模型的参数进行优化,以生成优化后的知识图谱对齐模型,其中,所述对齐节点携带正样本标签,所述K个负样本节点携带K个负样本标签。7.如权利要求6所述的知识图谱对齐模型训练方法,其特征在于,所述根据所述N个相似度值,确定所述训练节点在所述第二训练知识图谱中的对齐节点及K个负样本节点,包括:根据最大的相似度值对应的第二训练节点,确定所述训练节点在所述第二训练知识图谱中的对齐节点;根据大于相似度阈值且小于最大相似度值的相似度值对应的K个第二训练节点,确定K个负样本节点。8.如权利要求6所述的知识图谱对齐模型...

【专利技术属性】
技术研发人员:林镇溪张子恒吴贤
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1