【技术实现步骤摘要】
知识图谱的实体对齐方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种知识图谱的实体对齐方法、装置、计算机设备和存储介质。
技术介绍
随着科学技术的发展,出现了知识图谱技术,知识图谱是描述实体以及实体之前关系的必要基础,而知识图谱对齐技术则是快速工程化搭建知识图谱的重要利器。知识图谱对齐旨在判断两个或多个不同知识图谱中是否存在指向真实世界中的同一个对象的实体,如果存在,则在这些实体之间构建对齐关系,从而基于对齐关系融合多个知识图谱,形成完整的、知识覆盖更广的知识图谱。传统技术中,可以通过预训练的神经网络对知识图谱进行实体对齐处理。然而,在基于预训练的神经网络对知识图谱进行实体对齐处理之前,往往需要依赖知识图谱专业人员对至少两个知识图谱中相同的实体进行标注处理,得到包含有标注标签的训练样本,并通过训练样本对待训练的实体对齐模型进行训练。其中,整个标注过程耗时耗力,从而导致知识图谱的对齐效率低。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提升知识图谱对齐效率的知识图谱的实体对齐方法、装置、计算机设备和存储介质。一种知识图谱的实体对齐方法,所述方法包括:获取待处理的至少两个知识图谱,并确定属于无监督学习类别的第一对齐子模型和属于有监督学习类别的第二对齐子模型;基于所述第二对齐子模型前个轮次输出的对齐处理结果,启动所述第一对齐子模型,以对所述至少两个知识图谱进行对齐概率推导处理,得到当前轮次成功配对的配对实体对集合;根据所述配对 ...
【技术保护点】
1.一种知识图谱的实体对齐方法,其特征在于,所述方法包括:/n获取待处理的至少两个知识图谱,并确定属于无监督学习类别的第一对齐子模型和属于有监督学习类别的第二对齐子模型;/n基于所述第二对齐子模型前个轮次输出的对齐处理结果,启动所述第一对齐子模型,以对所述至少两个知识图谱进行对齐概率推导处理,得到当前轮次成功配对的配对实体对集合;/n根据所述配对实体对集合对当前轮次的第二对齐子模型进行有监督训练;/n通过当前轮次训练得到的第二对齐子模型,对所述至少两个知识图谱进行多维度图谱嵌入处理,基于相应的图谱嵌入结果输出当前轮次的对齐处理结果;/n将所述当前轮次的对齐处理结果作为下个轮次中的前个轮次输出的对齐处理结果,进入下个轮次,并返回所述基于所述第二对齐子模型前个轮次输出的对齐处理结果,启动所述第一对齐子模型的步骤继续执行,直至达到第一停止条件时停止,得到与所述至少两个知识图谱对应的实体对齐结果。/n
【技术特征摘要】
1.一种知识图谱的实体对齐方法,其特征在于,所述方法包括:
获取待处理的至少两个知识图谱,并确定属于无监督学习类别的第一对齐子模型和属于有监督学习类别的第二对齐子模型;
基于所述第二对齐子模型前个轮次输出的对齐处理结果,启动所述第一对齐子模型,以对所述至少两个知识图谱进行对齐概率推导处理,得到当前轮次成功配对的配对实体对集合;
根据所述配对实体对集合对当前轮次的第二对齐子模型进行有监督训练;
通过当前轮次训练得到的第二对齐子模型,对所述至少两个知识图谱进行多维度图谱嵌入处理,基于相应的图谱嵌入结果输出当前轮次的对齐处理结果;
将所述当前轮次的对齐处理结果作为下个轮次中的前个轮次输出的对齐处理结果,进入下个轮次,并返回所述基于所述第二对齐子模型前个轮次输出的对齐处理结果,启动所述第一对齐子模型的步骤继续执行,直至达到第一停止条件时停止,得到与所述至少两个知识图谱对应的实体对齐结果。
2.根据权利要求1所述的方法,其特征在于,每个所述知识图谱包括至少一个知识多元组,所述知识多元组包括头实体、尾实体、以及所述头实体和所述尾实体之间的实体参考关系;
所述基于所述第二对齐子模型前个轮次输出的对齐处理结果,启动所述第一对齐子模型,以对所述至少两个知识图谱进行对齐概率推导处理,得到当前轮次成功配对的配对实体对集合,包括:
基于所述知识多元组,并通过所述第一对齐子模型确定每个所述实体参考关系各自对应的函数性;所述函数性表征了在头实体已确定的情况下,基于所述实体参考关系确定对应尾实体的概率;
基于所述第二对齐子模型前个轮次输出的对齐处理结果和每个所述实体参考关系各自对应的函数性,通过所述第一对齐子模型对待处理的知识图谱进行至少一次的概率推导,并根据最后一次概率推导所得到的概率推导结果,得到当前轮次成功配对的配对实体对集合。
3.根据权利要求2所述的方法,其特征在于,所述基于所述第二对齐子模型前个轮次输出的对齐处理结果和每个所述实体参考关系各自对应的函数性,通过所述第一对齐子模型对待处理的知识图谱进行至少一次的概率推导,并根据最后一次概率推导所得到的概率推导结果,得到当前轮次成功配对的配对实体对集合,包括:
确定所述第二对齐子模型前个轮次输出的对齐处理结果;
通过所述第一对齐子模型,获取在当前轮次中进行前次推导迭代所输出的每两个实体参考关系之间的关系对齐概率、以及每两个实体之间的实体对齐概率;其中,所述第一对齐子模型在一个当前轮次中发生多次推导迭代;
根据前个轮次输出的对齐处理结果、所述函数性、前次推导迭代所输出的关系对齐概率和实体对齐概率,通过所述第一对齐子模型进行当次的概率推导,输出当次推导迭代所对应的实体对齐概率;其中,每两个实体参考关系和每两个实体分别来源于不同的知识图谱;
通过所述第一对齐子模型,根据所述函数性和所述当次推导迭代所对应的实体对齐概率,确定当次推导迭代所对应的关系对齐概率;
进入所述当前轮次中下次的推导迭代过程,并将所述下次的推导迭代作为当次推导迭代,返回所述通过所述第一对齐子模型,获取在当前轮次中进行前次推导迭代所输出的每两个实体参考关系之间的关系对齐概率、以及每两个实体之间的实体对齐概率的步骤继续执行,直至达到第二停止条件时停止,得到最后一次概率推导所得到的最终实体对齐概率;
根据所述最终实体对齐概率,确定当前轮次成功配对的配对实体对集合。
4.根据权利要求3所述的方法,其特征在于,所述对齐处理结果包括所述知识图谱中的每个实体各自对应的图谱嵌入向量;
所述根据前个轮次输出的对齐处理结果、所述函数性、前次推导迭代所输出的关系对齐概率和实体对齐概率,通过所述第一对齐子模型进行当次的概率推导,输出当次推导迭代所对应的实体对齐概率,包括:
确定前个轮次输出对齐处理结果中的每两个图谱嵌入向量之间的相似度;
根据所述每两个图谱嵌入向量之间的相似度、所述函数性、前次推导迭代所输出的关系对齐概率和实体对齐概率,输出当次推导迭代所对应的实体对齐概率。
5.根据权利要求1所述的方法,其特征在于,所述根据所述配对实体对集合对当前轮次的第二对齐子模型进行有监督训练,包括:
对于所述配对实体对集合中的多个配对实体对,均确定每个配对实体对所包括的实体之间的语义相似度;
根据每个配对实体对所包括的实体之间的语义相似度,对所述配对实体对集合中的实体对进行一致性筛选,得到相似实体对;
通过筛选得到的所述相似实体对,对当前轮次的第二对齐子模型进行有监督训练。
6.根据权利要求1所述的方法,其特征在于,所述知识图谱包括至少一个知识多元组;所述知识多元组包括头实体、尾实体、以及所述头实体和所述尾实体之间的实体参考关系;所述实体参考关系包括相关关系和属性关系;所述根据所述配对实体对集合对当前轮次的第二对齐子模型进行有监督训练,包括:
根据所述知识多元组所包括的实体,对所述第二对齐子模型中的编码结构进行第一训练;
根据所述知识多元组中的相关关系,对所述第二对齐子模型中的关系嵌入结构进行第二训练;
根据所述知识多元组中的属性关系,对所述第二对齐子模型中的属性嵌入结构进行第三训练;
根据所述配对实体对集合,对通过第二训练的关系嵌入结构和通过第三训练的属性嵌入结构均进行优...
【专利技术属性】
技术研发人员:张子恒,齐志远,向玥佳,陈曦,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。