动态知识图谱补全方法、装置以及电子设备制造方法及图纸

技术编号:31581692 阅读:16 留言:0更新日期:2021-12-25 11:25
本发明专利技术公开了一种动态知识图谱补全方法、装置以及电子设备,动态知识图谱补全方法包括:获取待补全的动态知识图谱的四元组关系式中的已知实体、已知关系和已知时间信息;依据所述已知实体和所述已知关系获得与所述已知时间信息对应的最终实体嵌入;预测所述最终实体嵌入作为缺失实体的概率;其中,获得与所述已知时间信息对应的最终实体嵌入包括:将所述已知实体、所述已知关系和所述已知时间信息对应的第一时间步作为结构编码器的输入,获得所述第一时间步的第一结构化实体嵌入;将所述第一结构化实体嵌入作为所述最终实体嵌入。本发明专利技术通过结构化实体表示体现动态知识图谱的多跳结构信息,充分挖掘邻域信息,提高动态知识图谱的补全率。图谱的补全率。图谱的补全率。

【技术实现步骤摘要】
动态知识图谱补全方法、装置以及电子设备


[0001]本专利技术涉及计算机
,尤其涉及一种动态知识图谱补全方法、装置以及电子设备。

技术介绍

[0002]近年来,知识图谱作为结构化人类知识的一种形式,受到了学术界的广泛关注。根据现有研究,可将知识图谱分为静态知识图谱和动态知识图谱。动态知识图谱中包含大量的动态事实类知识。然而动态知识图谱仍然存在不完整的问题。推理补全动态知识图谱中缺失的动态事实类知识是一项具有挑战性的任务,对于事件预测、社会网络分析和推荐系统等应用至关重要。
[0003]静态知识图谱将事实表示为三元组(主题,关系,对象)(主语,谓语,宾语),如(伏明霞,参加,跳水比赛),而动态知识图谱则将每个三元组与时间戳关联起来,如(伏明霞,参加,跳水比赛,2000)。动态知识图谱被认为是由离散时间戳组成的,这意味着它们可以被表示为一系列静态的知识图谱快照(snapshot),在这些知识图谱快照中推理补全缺失事实的任务被称为动态知识图谱补全(Temporal Knowledge Graph Completion,简称TKGC)。
[0004]知识图谱表示(Knowledge Graph Embedding,简称KGE)是知识图谱补全(Knowledge Graph Completion,简称KGC)的前提与支撑,旨在将实体和关系映射到低维的向量空间,从而实现对实体和关系的语义信息的表示。传统的知识图谱表示方法忽略了已知时间信息,无法胜任与时间维度信息有关的知识推理任务。为了解决这个问题,近年来国内外研究者们开始将已知时间信息编码到知识图谱表示当中以提高知识图谱推理补全的性能。这种包含已知时间信息的知识图谱表示可以称之为动态知识图谱表示(Temporal Knowledge Graph Embedding,简称TKGE),用于动态知识图谱的推理与补全。然而,现有的大部分动态知识图谱表示方法只简单的将已知时间信息嵌入到知识表示中,这些方法还较为初步,只考虑了已知时间信息而忽略了图谱本身的拓扑结构信息,因此在时间和结构信息的综合建模方面尚有较大的进步空间。
[0005]动态知识图谱表示目前主要考虑如何将已知时间信息嵌入到知识表示中。最早的工作提出首先学习关系之间的时间顺序(如wasBorIn

wonPrize

diedIn),然后在知识图谱表示阶段将这些关系顺序合并为约束,没有直接将已知时间信息融入到所学到的表示中。TransE提出了多种已知时间信息表示方法。如将已知时间信息和关系拼接一同表示,时间与实体和关系在同一个向量空间中表示,时间点具有单独表示以及时间点被用作影响三元组关系表示的系数。HyTE将动态知识图谱分割成多个静态子图,每个子图对应于一个时间戳。然后将实体和每个子图的关系投射到时间戳特定的超平面上,学习超平面(法向量)和知识图谱元素随时间分布的共同表示。然而当时间戳数量很大时效果不佳,且无法推广到新的时间戳上。TA

TransE将给定的时间戳分解为由时间标记组成的序列,然后将关系标记和时间修饰符标记(如since或until)序列与时间标记序列连接并经过处理后作为LSTM的输入编码后得到谓词序列表示。DE

SimplE则认为实体有一些特征是固定的有一些会随
着时间变化,因此他提出历时嵌入函数以在不同的时间点控制实体特征表示。
[0006]现有的关于动态知识图谱补全的工作主要集中于在已知时间信息表示上做一些改进,研究依赖于时间的评分函数上,与静态知识图谱表示方法相结合,对缺失事实的可能性进行评分,从而完成动态知识图谱补全任务。尽管这些方法能有效补全缺失的动态事实类知识,但它们没有考虑到动态知识图谱中的多跳结构信息,对邻域信息的挖掘和补全效果欠佳。
[0007]并且,现有的方法缺乏利用附近知识图谱快照中的时间事实来回答查询(query)的能力。如(伏明霞,获得,女子3米板冠军,1996)或(伏明霞,参加,悉尼奥运会,2000)这样的事实有助于回答(伏明霞,获得,?,2000)对于尾实体的查询。

技术实现思路

[0008]鉴于上述,本专利技术旨在提供一种动态知识图谱补全方法、装置以及电子设备,并相应地提出一种计算机可读存储介质,通过这些方面能够通过结构化实体表示体现动态知识图谱的多跳结构信息,充分挖掘邻域信息,提高动态知识图谱的补全率。
[0009]本专利技术采用的技术方案如下:
[0010]第一方面,本专利技术提供了一种动态知识图谱补全方法,包括:
[0011]获取待补全的动态知识图谱的四元组关系式中的已知实体、已知关系和已知时间信息,所述已知实体包括头实体或尾实体;
[0012]依据所述已知实体和所述已知关系获得与所述已知时间信息对应的最终实体嵌入;
[0013]预测所述最终实体嵌入作为缺失实体的概率;
[0014]其中,获得与所述已知时间信息对应的最终实体嵌入包括:
[0015]将所述已知实体、所述已知关系和所述已知时间信息对应的第一时间步作为结构编码器的输入,获得所述第一时间步的第一结构化实体嵌入;
[0016]将所述第一结构化实体嵌入作为所述最终实体嵌入。
[0017]在其中一种可能的实现方式中,获得与所述已知时间信息对应的最终实体嵌入还包括:
[0018]将所述第一时间步之前的所述已知实体处于活跃状态的最后一个时间步作为第二时间步;
[0019]将所述第一结构化实体嵌入和所述第二时间步的第一动态实体嵌入作为时间编码器的输入,获得所述第一时间步的第二动态实体嵌入,作为所述第一时间步的最终动态实体嵌入;
[0020]并且,
[0021]将所述最终动态实体嵌入作为所述最终实体嵌入。
[0022]在其中一种可能的实现方式中,获得与所述已知时间信息对应的最终实体嵌入还包括:
[0023]将所述第一时间步之前的所述已知实体处于活跃状态的最后一个时间步作为第二时间步;
[0024]将所述已知实体、所述已知关系和所述第二时间步作为结构编码器的输入,获得
所述第二时间步的第二结构化实体嵌入;
[0025]利用归因理论,结合所述第一结构化实体嵌入和所述第二结构化实体嵌入获得所述第一时间步的第三结构化实体嵌入;
[0026]将所述第三结构化实体嵌入和所述第二时间步的第一动态实体嵌入作为时间编码器的输入,获得所述第一时间步的第三动态实体嵌入,作为所述第一时间步的最终动态实体嵌入;
[0027]并且,
[0028]将所述最终动态实体嵌入作为所述最终实体嵌入。
[0029]在其中一种可能的实现方式中,获得与所述已知时间信息对应的最终实体嵌入还包括:
[0030]利用门控机制,依据所述第一结构化实体嵌入和所述最终动态实体嵌入获得综合实体嵌入,作为所述最终实体嵌入。
[0031]在其中一种可能的实现方式中,所述结构编码器包括基于多关系的消息传递神本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动态知识图谱补全方法,其特征在于,包括:获取待补全的动态知识图谱的四元组关系式中的已知实体、已知关系和已知时间信息,所述已知实体包括头实体或尾实体;依据所述已知实体和所述已知关系获得与所述已知时间信息对应的最终实体嵌入;预测所述最终实体嵌入作为缺失实体的概率;其中,获得与所述已知时间信息对应的最终实体嵌入包括:将所述已知实体、所述已知关系和所述已知时间信息对应的第一时间步作为结构编码器的输入,获得所述第一时间步的第一结构化实体嵌入;将所述第一结构化实体嵌入作为所述最终实体嵌入。2.根据权利要求1所述的动态知识图谱补全方法,其特征在于,获得与所述已知时间信息对应的最终实体嵌入还包括:将所述第一时间步之前的所述已知实体处于活跃状态的最后一个时间步作为第二时间步;将所述第一结构化实体嵌入和所述第二时间步的第一动态实体嵌入作为时间编码器的输入,获得所述第一时间步的第二动态实体嵌入,作为所述第一时间步的最终动态实体嵌入;并且,将所述最终动态实体嵌入作为所述最终实体嵌入。3.根据权利要求1所述的动态知识图谱补全方法,其特征在于,获得与所述已知时间信息对应的最终实体嵌入还包括:将所述第一时间步之前的所述已知实体处于活跃状态的最后一个时间步作为第二时间步;将所述已知实体、所述已知关系和所述第二时间步作为结构编码器的输入,获得所述第二时间步的第二结构化实体嵌入;利用归因理论,结合所述第一结构化实体嵌入和所述第二结构化实体嵌入获得所述第一时间步的第三结构化实体嵌入;将所述第三结构化实体嵌入和所述第二时间步的第一动态实体嵌入作为时间编码器的输入,获得所述第一时间步的第三动态实体嵌入,作为所述第一时间步的最终动态实体嵌入;并且,将所述最终动态实体嵌入作为所述最终实体嵌入。4.根据权利要求2或3所述的动态知识图谱补全方法,其特征在于,获得与所述已知时间信息对应的最终实体嵌入还包括:利用门控机制,依据所述第一结构化实体嵌入和所述最终动态实体嵌入获得综合实体嵌入,作为所述最终实体嵌入。5.根据权利要求1所述的动态知识图谱补全方法,其特征在于,所述结构编码器包括基于多关系的消息传递神经网络的第一训练模型。6.根据权利要求2或3所述的动态知识图谱补全方法,其特征在于,所述时间编码器包括基于循环神经网络的第二训练模型。
7.根据权利要求6所述的动态知识图谱补全方法,其特征在于,获得所述第一时间步的第二动态实体嵌入,包括:计算所述第一动态实体嵌入的第一衰减率;依据所述第一衰减率和所述第一动态实体嵌入计算所述第二时间步的第四动态实体嵌入;将所述第一结构化实体嵌入和所述第四动态实体嵌入作为所述时间编码器的输入,获得所述第一时间步的第二动态实体嵌入。8.根据权利要求3所述的动态知识图谱补全方法,其特征在于,获得所述第三结构化实体嵌入,包括:计算所述第二时间步与所述第一时间步之间所述已知实体的第二衰减率,将所述第二衰减率作为所述第二结构化实体嵌入对所述第三结构化实体嵌入的第一权重;利用所述第一权重、所述第一结构化实体嵌入、所述第二结构化实体嵌入计算加权和,作为第三结构化实体嵌入。9.根据权利要求3所述的动态知识图谱补全方法,其特征在于,获得所述第三结构化实体嵌入,包括:计算所述第二时间步与所述第一时间步之间所述已知实体的第二衰减率,将所述第二衰减率作为所述第二结构化实体嵌入对所述第三结构化实体嵌入的第一权重;将所述第一时间步之后所述已知实体处于活跃状态的最近一个时间步作为第三时间步;将所述已知实体、所述已知关系和所述第三时间步作为结构编码器的输入,获取所述第三时间步的第四结构化实体嵌入;计算所述第三时间...

【专利技术属性】
技术研发人员:李直旭陈志刚何莹曹思远
申请(专利权)人:科大讯飞苏州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1