本申请涉及一种子图特征融合的链接预测方法、装置及计算机设备,通过根据查询问句的表示形式选取对应的搜索策略对待进行链接预测的知识图谱进行搜索,得到与查询问句相关的上下文子图,将上下文子图输入到嵌入层采用词嵌入方法学习子图中所有实体和关系信息从而得到静态向量表,接着采用基于多头自注意力机制的双塔层以及基于交叉注意力机制的特征融合层,先分别对静态向量表和查询问句进行语义特征提取,再将语义特征进行融合,最后由预测层对融合特征进行预测,以实现对知识图谱的连接预测。采用本方法可提高实体链接预测的性能,且该方法适用于具有大量实体数据的工业领域的知识图谱的链接预测中。域的知识图谱的链接预测中。域的知识图谱的链接预测中。
【技术实现步骤摘要】
基于子图特征融合的链接预测方法、装置及计算机设备
[0001]本申请涉及知识图谱
,特别是涉及一种基于子图特征融合的链接预测方法、装置及计算机设备。
技术介绍
[0002]知识图谱(Knowledge Graph)通常以(头实体,关系,尾实体)三元组的形式对各种非结构化数据进行编码。随着近年来知识图谱地飞速发展,引领了信息挖掘,信息检索等知识图谱下游任务技术的不断更新,成为了解决问答系统,推荐系统等现实问题中必不可少的一部分。然而知识的多样性和复杂性不可避免地造成了知识图谱地不完整性。
[0003]而链接预测任务旨在预测知识图谱中的潜在三元组,解决了知识多样性与图谱不完整性之间的鸿沟。早期的链接预测方法主要通过学习知识图谱中每个实体和关系嵌入向量,然后通过简单的评分函数来计算新实体合理性。其中,希望每个实体和关系的嵌入都能够学习到紧凑的编码结构和语义信息,这样通过简单的评分函数能够做出准确的判断。然而,将知识图谱中丰富的信息完全编码到浅层的嵌入中是一项巨大的挑战。
技术实现思路
[0004]基于此,有必要针对上述技术问题,提供一种能够提高预测性能的基于子图特征融合的链接预测方法、装置及计算机设备。
[0005]一种基于子图特征融合的链接预测方法,所述方法包括:
[0006]获取待进行链接预测的知识图谱以及查询问句;
[0007]根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索,得到与所述查询问句相关的上下文子图;
[0008]将所述上下文子图输入嵌入层,在所述嵌入层中采用词嵌入方法学习所述上下文子图中的所有实体和关系信息,输出与所述上下文子图相关的静态向量表;
[0009]将所述静态向量表与查询问句输入基于多头自注意力机制的双塔层中,分别提取所述静态向量表与查询问句的查询语义特征以及上下文子图语义特征;
[0010]将所述查询语义特征以及上下文子图语义特征输入基于交叉注意力机制的特征融合层,得到语义融合特征;
[0011]将所述语义融合特征以及上下文子图语义特征输入预测层,对所述上下文子图中各实体的概率分布,以实现对所述知识图谱的链接预测。
[0012]在其中一实施例中,所述根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索包括:
[0013]当所述查询问句中源实体未知时,则采用广度有限搜索或基于二跳的邻近搜索对所述知识图谱进行搜索;
[0014]当所述查询问句中目标实体未知时,则采用强化学习网络对所述知识图谱进行搜索。
[0015]在其中一实施例中,所述强化学习网络采用MSURL模型,并采用演员
‑
评论家的强化学习算法对所述MSURL模型进行训练。
[0016]在其中一实施例中,在将所述上下文子图输入至所述嵌入层后,先将所述上下文子图按照主体和关系进行分类,再分别进行词查表嵌入、词类型嵌入和词分段嵌入,将得到的嵌入数据进行合并后与所述上下文子图相关的静态向量表。
[0017]在其中一实施例中,所述基于多头自注意力机制的双塔层包括两个相同的自注意力机制单元,分别对所述静态向量表和查询问句进行特征提取,相应得到所述查询语义特征以及上下文子图语义特征。
[0018]在其中一实施例中,所述嵌入层、基于多头自注意力机制的双塔层、基于交叉注意力机制的特征融合层以及预测层集成为知识图谱链接预测网络;
[0019]将所述待进行链接预测的知识图谱以及查询问句输入所述知识图谱链接预测网络中,得到所述知识图谱中与查询问句相关的上下文子图中各实体的概率分布,以实现对所述知识图谱的链接预测。
[0020]一种基于子图特征融合的链接预测装置,所述装置包括:
[0021]数据获取模块,用于获取待进行链接预测的知识图谱以及查询问句;
[0022]子图得到模块,用于根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索,得到与所述查询问句相关的上下文子图;
[0023]静态向量表得到模块,用于将所述上下文子图输入嵌入层,在所述嵌入层中采用词嵌入方法学习所述上下文子图中的所有实体和关系信息,输出与所述上下文子图相关的静态向量表;
[0024]语义特征提取模块,用于将所述静态向量表与查询问句输入基于多头自注意力机制的双塔层中,分别提取所述静态向量表与查询问句的查询语义特征以及上下文子图语义特征;
[0025]语义特征融合模块,用于将所述查询语义特征以及上下文子图语义特征输入基于交叉注意力机制的特征融合层,得到语义融合特征;
[0026]链接预测模块,用于将所述语义融合特征以及上下文子图语义特征输入预测层,对所述上下文子图中各实体的概率分布,以实现对所述知识图谱的链接预测。
[0027]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0028]获取待进行链接预测的知识图谱以及查询问句;
[0029]根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索,得到与所述查询问句相关的上下文子图;
[0030]将所述上下文子图输入嵌入层,在所述嵌入层中采用词嵌入方法学习所述上下文子图中的所有实体和关系信息,输出与所述上下文子图相关的静态向量表;
[0031]将所述静态向量表与查询问句输入基于多头自注意力机制的双塔层中,分别提取所述静态向量表与查询问句的查询语义特征以及上下文子图语义特征;
[0032]将所述查询语义特征以及上下文子图语义特征输入基于交叉注意力机制的特征融合层,得到语义融合特征;
[0033]将所述语义融合特征以及上下文子图语义特征输入预测层,对所述上下文子图中
各实体的概率分布,以实现对所述知识图谱的链接预测。
[0034]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0035]获取待进行链接预测的知识图谱以及查询问句;
[0036]根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索,得到与所述查询问句相关的上下文子图;
[0037]将所述上下文子图输入嵌入层,在所述嵌入层中采用词嵌入方法学习所述上下文子图中的所有实体和关系信息,输出与所述上下文子图相关的静态向量表;
[0038]将所述静态向量表与查询问句输入基于多头自注意力机制的双塔层中,分别提取所述静态向量表与查询问句的查询语义特征以及上下文子图语义特征;
[0039]将所述查询语义特征以及上下文子图语义特征输入基于交叉注意力机制的特征融合层,得到语义融合特征;
[0040]将所述语义融合特征以及上下文子图语义特征输入预测层,对所述上下文子图中各实体的概率分布,以实现对所述知识图谱的链接预测。
[0041]上述基于子图特征融合的链接预测方法、装置及计算机设备,通过根据查询问句的表示形式选取对应的搜本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.基于子图特征融合的链接预测方法,其特征在于,所述方法包括:获取待进行链接预测的知识图谱以及查询问句;根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索,得到与所述查询问句相关的上下文子图;将所述上下文子图输入嵌入层,在所述嵌入层中采用词嵌入方法学习所述上下文子图中的所有实体和关系信息,输出与所述上下文子图相关的静态向量表;将所述静态向量表与查询问句输入基于多头自注意力机制的双塔层中,分别提取所述静态向量表与查询问句的查询语义特征以及上下文子图语义特征;将所述查询语义特征以及上下文子图语义特征输入基于交叉注意力机制的特征融合层,得到语义融合特征;将所述语义融合特征以及上下文子图语义特征输入预测层,对所述上下文子图中各实体的概率分布,以实现对所述知识图谱的链接预测。2.根据权利要求1所述的链接预测方法,其特征在于,所述根据所述查询问句的表示形式选取对应的搜索策略对所述知识图谱进行搜索包括:当所述查询问句中源实体未知时,则采用广度有限搜索或基于二跳的邻近搜索对所述知识图谱进行搜索;当所述查询问句中目标实体未知时,则采用强化学习网络对所述知识图谱进行搜索。3.根据权利要求2所述的链接预测方法,其特征在于,所述强化学习网络采用MSURL模型,并采用演员
‑
评论家的强化学习算法对所述MSURL模型进行训练。4.根据权利要求1所述的链接预测方法,其特征在于,在将所述上下文子图输入至所述嵌入层后,先将所述上下文子图按照主体和关系进行分类,再分别进行词查表嵌入、词类型嵌入和词分段嵌入,将得到的嵌入数据进行合并后与所述上下文子图相关的静态向量表。5.根据权利要求1所述的链接预测方法,其特征在于,所述基于多头自注意力机制的双塔...
【专利技术属性】
技术研发人员:滕磊,靖琦东,全文斌,谢宇,胡丹,刘耀澳,李佩,余艺韩,文艳,李霜,
申请(专利权)人:中电工业互联网有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。