本申请提供一种基于图神经网络的时序知识图谱的补全方法及相关设备。该方法包括:获取多个历史时刻的时序知识图谱和当前时刻的时序知识图谱,分别对每个所述时序知识图谱进行预处理;将经过所述预处理的全部所述时序知识图谱输入至经过预训练的补全模型中,得到当前时刻的所述时序知识图谱上每个节点的最终表示向量;通过相似度计算模型从预先构建的候选集中选取与所述最终表示向量对应的节点的相似度最大的候选节点作为补全节点,并基于所述补全节点对当前时刻的所述时序知识图谱进行补全。本申请提供一种基于图神经网络的时序知识图谱的补全方法及相关设备可方便有效地补全时序知识图谱。补全时序知识图谱。补全时序知识图谱。
【技术实现步骤摘要】
基于图神经网络的时序知识图谱的补全方法及相关设备
[0001]本专利技术涉及机器学习领域,尤其涉及一种基于图神经网络的时序知识图谱的补全方法及相关设备。
技术介绍
[0002]随着互联网、物联网、云计算等信息技术的不断发展,数据的快速增长已经成为许多行业共同面对的严峻挑战和宝贵机遇,整个社会已经迈入了大数据时代。为了更好地利用知识,谷歌于2012年,在语义研究热潮中提出知识图谱的概念。与普通的关系数据库相比,知识图谱是一种描述真实世界客观存在的实体、概念及它们之间的关联关系的语义网络,用于以符号形式描述物理世界中的实体、概念及其相互关系。这些结构化的知识促进了人和计算机对知识的理解和利用,是人工智能应用实现的知识基础。
[0003]目前,大量研究工作针对静态知识图谱,但是现有的知识图谱中,不少图谱都具有时间标识,这样的知识图谱称为时序知识图谱。时间作为自然事物发展的一个重要特征,它能描述事件的发展和演化模式,因此时序知识图谱具有更大的使用价值。与静态知识图谱相似,时序知识图谱也并不是完备的,仍然需要对其进行不断地补充。目前相关技术中对时序知识图谱的研究较少,因此如何补全时序知识图谱成为研究的难点问题。
技术实现思路
[0004]有鉴于此,本申请的目的在于提出一种基于图神经网络的时序知识图谱的补全方法及相关设备。
[0005]基于上述目的,本申请提供一种基于图神经网络的时序知识图谱的补全方法,包括:
[0006]获取多个历史时刻的时序知识图谱和当前时刻的时序知识图谱,分别对每个所述时序知识图谱进行预处理;
[0007]将经过所述预处理的全部所述时序知识图谱输入至经过预训练的补全模型中,得到当前时刻的所述时序知识图谱上每个节点的最终表示向量;
[0008]通过相似度计算模型从预先构建的候选集中选取与所述最终表示向量对应的节点的相似度最大的候选节点作为补全节点,并基于所述补全节点对当前时刻的所述时序知识图谱进行补全。
[0009]进一步的,所述预处理包括分别对所述时序知识图谱上的每个所述节点进行提取,以得到该节点对应的全部三元组。
[0010]进一步的,所述节点对应的全部三元组包括以所述节点为尾实体的所有入边三元组和以所述节点为头实体的所有出边三元组。
[0011]进一步的,所述将经过所述预处理的全部所述时序知识图谱输入至经过预训练的补全模型中,得到当前时刻的所述时序知识图谱上每个节点的最终表示向量,包括:
[0012]将每一个所述时序知识图谱中的每个节点对应的全部所述入边三元组和所述出
边三元组进行嵌入,得到入边三元组的表示向量和出边三元组的表示向量;
[0013]基于所述入边三元组的表示向量和所述出边三元组的表示向量通过多头注意力机制计算得到当前时刻的所述时序知识图谱上每个节点的最终表示向量。
[0014]进一步的,所述基于所述入边三元组的表示向量和所述出边三元组的表示向量通过多头注意力机制计算得到当前时刻的所述时序知识图谱上每个节点的最终表示向量,包括:
[0015]通过Softmax函数对全部所述节点的所有所述入边三元组和所述出边三元组进行归一化,得到每个所述节点的入边三元组注意力系数和出边三元组注意力系数;
[0016]基于所述入边三元组注意力系数和所述出边三元组注意力系数通过多头注意力机制进行计算,分别得到所述节点的入边三元组聚合空间信息表示向量和出边三元组聚合空间信息表示向量;
[0017]通过门限函数将所述入边三元组聚合空间信息表示向量和所述出边三元组聚合空间信息表示向量进行聚合,得到所述节点的空间信息表示向量;
[0018]通过时间衰减函数将所述节点的时间信息与所述空间信息表示向量相结合,计算该节点的每个历史时刻的空间信息表示向量与当前时刻的空间信息表示向量之间的相关度,并基于所述相关度计算出该节点的每个历史时刻的注意力值;
[0019]基于所述注意力值和所述节点的所述空间信息表示向量进行计算,得到所述所有节点的最终表示向量。
[0020]进一步的,所述预训练包括:
[0021]构建训练集;
[0022]通过所述训练集及预先构建的目标函数对所述补全模型进行迭代训练,对所述目标函数进行最小化以得到所述补全模型。
[0023]进一步的,所述候选集包括多个候选节点,构建所述候选集包括:
[0024]从所述当前时刻的时序知识图谱上选取与所述节点存在未知关系的邻居节点作为所述候选集中的所述候选节点。
[0025]基于同一专利技术构思,本申请还提供了一种基于图神经网络的时序知识图谱的补全装置,包括:
[0026]预处理模块,被配置为获取多个历史时刻的时序知识图谱和当前时刻的时序知识图谱,分别对每个所述时序知识图谱进行预处理;
[0027]生成最终表示向量模块,被配置为将经过所述预处理的全部所述时序知识图谱输入至经过预训练的补全模型中,得到当前时刻的所述时序知识图谱上每个节点的最终表示向量;
[0028]补全模块,被配置为通过相似度计算模型从预先构建的候选集中选取与所述最终表示向量对应的节点的相似度最大的候选节点作为补全节点,并基于所述补全节点对当前时刻的所述时序知识图谱进行补全。
[0029]基于同一专利技术构思,本申请还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上任意所述的方法。
[0030]基于同一专利技术构思,本申请还提供了一种非暂态计算机可读存储介质,所述非暂
态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上任意所述的方法。
[0031]从上面所述可以看出,本申请提供的一种基于图神经网络的时序知识图谱的补全方法及相关设备,将获取的多个历史时刻的时序知识图谱和当前时刻的时序知识图谱输入至经过预训练的补全模型中,基于模型输出结果从构建的候选集中选取候选节点作为补全节点从而对时序知识图谱进行补全。通过结合多个历史时刻的已有三元组的空间信息和时间信息,通过图神经网络对当前时刻缺失的三元组进行补全,既考虑到了每个节点的时间的延续性,且通过图神经网络对空间信息进行了更全面的聚合,以提升对时序知识图谱补全的准确率。
附图说明
[0032]为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0033]图1为本申请实施例的基于图神经网络的时序知识图谱的补全方法的流程示意图;
[0034]图2为本申请实施例的TRANSE模型中的头尾实体关系的示意图;
[0035]图3为本申请实施例的当前时刻的时序知识图谱的结构示意图;
[0036]图4为本申请实施例的基于图神经网络的时序知识图谱的补全装置本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于图神经网络的时序知识图谱的补全方法,其特征在于,包括:获取多个历史时刻的时序知识图谱和当前时刻的时序知识图谱,分别对每个所述时序知识图谱进行预处理;将经过所述预处理的全部所述时序知识图谱输入至经过预训练的补全模型中,得到当前时刻的所述时序知识图谱上每个节点的最终表示向量;通过相似度计算模型从预先构建的候选集中选取与所述最终表示向量对应的节点的相似度最大的候选节点作为补全节点,并基于所述补全节点对当前时刻的所述时序知识图谱进行补全。2.根据权利要求1所述的方法,其特征在于,所述预处理包括:分别对所述时序知识图谱上的每个所述节点进行提取,以得到该节点对应的全部三元组。3.根据权利要求2所述的方法,其特征在于,所述节点对应的全部三元组包括以所述节点为尾实体的所有入边三元组和以所述节点为头实体的所有出边三元组。4.根据权利要求3所述的方法,其特征在于,所述将经过所述预处理的全部所述时序知识图谱输入至经过预训练的补全模型中,得到当前时刻的所述时序知识图谱上每个节点的最终表示向量,包括:将每一个所述时序知识图谱中的每个节点对应的全部所述入边三元组和所述出边三元组进行嵌入,得到入边三元组的表示向量和出边三元组的表示向量;基于所述入边三元组的表示向量和所述出边三元组的表示向量通过多头注意力机制计算得到当前时刻的所述时序知识图谱上每个节点的最终表示向量。5.根据权利要求4所述的方法,其特征在于,所述基于所述入边三元组的表示向量和所述出边三元组的表示向量通过多头注意力机制计算得到当前时刻的所述时序知识图谱上每个节点的最终表示向量,包括:通过Softmax函数对全部所述节点的所有所述入边三元组和所述出边三元组进行归一化,得到每个所述节点的入边三元组注意力系数和出边三元组注意力系数;基于所述入边三元组注意力系数和所述出边三元组注意力系数通过多头注意力机制进行计算,分别得到所述节点的入边三元组聚合空间信息表示向量...
【专利技术属性】
技术研发人员:张忠宝,危倩,苏森,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。