本发明专利技术涉及自然语言处理技术领域,提供一种动态知识图谱预测方法、装置、电子设备及存储介质,该方法获取历史事件语料;将历史事件语料输入至图谱构建模型,得到当前时刻的知识图谱。该图谱构建模型通过隐含关系提取模块及关系编码模块实现对历史事件语料中隐含关系的提取及编码,通过实体时序表征模块得到当前时刻的知识图谱,使得到的知识图谱不仅包含有历史事件语料中各实体已经存在的关系信息,还包含在历史事件语料中隐含的各实体的关联关系,知识图谱的准确性更高,使知识图谱后续应用效果更佳。而且,通过历史事件语料的不断更新,可以实现知识图谱的准确动态预测。本发明专利技术已受到了国家重点研发计划项目(2019YQ1601)的资助。的资助。的资助。
【技术实现步骤摘要】
动态知识图谱预测方法、装置、电子设备及存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种动态知识图谱预测方法、装置、电子设备及存储介质。
技术介绍
[0002]传统的知识图谱(Knowledge Graphs,KGs)以结构化的方式将现实世界的各种实体和关系表示成了多关系数据,并被应用于各种下游任务,如信息检索、对话系统、阅读理解、医疗健康等。然而,现实世界中的事件通常是变化的,很多实体和关系的语义通常随时间发生演化,因此,动态知识图谱被提出并被广泛应用。
[0003]动态知识图谱主要通过抽取算法和工具从不同时间的文本语料中抽取出重要的实体和关系构建而成的。由于构建算法或工具的限制,只能抽取到实体间的表象关系,很多重要的隐含关系没有被发掘出来,这将导致实体间关联关系的缺失,在一定程度上限制了动态知识图谱的准确性,进而影响动态知识图谱的准确应用。
[0004]基于此,现亟需提供一种动态知识图谱预测方法,已解决现有技术中构建的动态知识图谱不准确的问题。
技术实现思路
[0005]本专利技术提供一种动态知识图谱预测方法、装置、电子设备及存储介质,用以解决现有技术中存在的缺陷。
[0006]本专利技术提供一种动态知识图谱预测方法,包括:
[0007]获取历史事件语料;
[0008]将所述历史事件语料输入至图谱构建模型,得到所述图谱构建模型输出的当前时刻的知识图谱;
[0009]其中,所述图谱构建模型包括结构编码器、隐含关系提取模块、关系编码模块和实体时序表征模块,所述图谱构建模型基于事件语料样本训练得到;
[0010]所述结构编码器用于提取所述历史事件语料中每一历史时刻的各实体和各实体之间的关系信息,基于所述各实体和所述关系信息,确定每一历史时刻的知识图谱,并对每一历史时刻的知识图谱进行结构编码,得到每一历史时刻的各实体的特征表达;
[0011]所述隐含关系提取模块用于基于每一历史时刻的各实体的特征表达,计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系,并基于所述第一关联关系和所述第二关联关系,构建实体关联关系图;
[0012]所述关系编码模块用于对所述实体关联关系图进行编码,得到所述实体关联关系图中各实体的邻居表征;
[0013]所述实体时序表征模块用于基于每一历史时刻的各实体的特征表达和所述实体关联关系图中各实体的邻居表征,提取所述当前时刻各实体的时序表征,并基于所述当前时刻各实体的时序表征,构建所述当前时刻的知识图谱。
[0014]根据本专利技术提供的一种动态知识图谱预测方法,基于每一历史时刻的各实体的特征表达,计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系,包括:
[0015]基于每一历史时刻的各实体的特征表达,计算每一历史时刻不存在所述关系信息的每两个实体之间的第一关联关系和任意两个历史时刻不存在所述关系信息的每两个实体之间的第二关联关系。
[0016]根据本专利技术提供的一种动态知识图谱预测方法,基于所述第一关联关系和所述第二关联关系,构建实体关联关系图,包括:
[0017]对所述第一关联关系进行稀疏化操作,得到第一稀疏化操作结果;
[0018]对所述第二关联关系进行稀疏化操作,得到第二稀疏化操作结果;
[0019]基于所述第一稀疏化操作结果和所述第二稀疏化操作结果,构建所述实体关联关系图。
[0020]根据本专利技术提供的一种动态知识图谱预测方法,所述关系编码模块为基于注意力机制的关系型图神经网络;
[0021]对所述实体关联关系图进行编码,得到所述实体关联关系图中各实体的邻居表征,包括:
[0022]计算所述实体关联关系图中相邻实体之间的注意力系数;
[0023]基于所述注意力系数,聚合所述实体关联关系图中各实体之间的关系表征,得到所述实体关联关系图中各实体的邻居表征。
[0024]根据本专利技术提供的一种动态知识图谱预测方法,所述时序表征包括全局时序表征和局部时序表征;
[0025]基于每一历史时刻的各实体的特征表达和所述实体关联关系图中各实体的邻居表征,提取所述当前时刻各实体的时序表征,包括:
[0026]对每一历史时刻的各实体的特征表达进行编码,得到所述当前时刻各实体的局部时序表征;
[0027]对所述实体关联关系图中各实体的邻居表征进行编码,得到所述当前时刻各实体的全局时序表征。
[0028]根据本专利技术提供的一种动态知识图谱预测方法,基于所述当前时刻各实体的时序表征,构建所述当前时刻的知识图谱,包括:
[0029]基于门控模块,将所述当前时刻各实体的局部时序表征和所述当前时刻各实体的全局时序表征进行融合,得到所述当前时刻各实体的融合结果;
[0030]基于所述融合结果,构建所述当前时刻的知识图谱。
[0031]根据本专利技术提供的一种动态知识图谱预测方法,基于每一历史时刻的各实体的特征表达,计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系,包括:
[0032]基于每一历史时刻的各实体的特征表达,使用余弦相似度度量函数计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系。
[0033]本专利技术还提供一种动态知识图谱预测装置,包括:
[0034]语料获取模块,用于获取历史事件语料;
[0035]图谱预测模块,用于将所述历史事件语料输入至图谱构建模型,得到所述图谱构建模型输出的当前时刻的知识图谱;
[0036]其中,所述图谱构建模型包括结构编码器、隐含关系提取模块、关系编码模块和实体时序表征模块,所述图谱构建模型基于事件语料样本训练得到;
[0037]所述结构编码器用于提取所述历史事件语料中每一历史时刻的各实体和各实体之间的关系信息,基于所述各实体和所述关系信息,确定每一历史时刻的知识图谱,并对每一历史时刻的知识图谱进行结构编码,得到每一历史时刻的各实体的特征表达;
[0038]所述隐含关系提取模块用于基于每一历史时刻的各实体的特征表达,计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系,并基于所述第一关联关系和所述第二关联关系,构建实体关联关系图;
[0039]所述关系编码模块用于对所述实体关联关系图进行编码,得到所述实体关联关系图中各实体的邻居表征;
[0040]所述实体时序表征模块用于基于每一历史时刻的各实体的特征表达和所述实体关联关系图中各实体的邻居表征,提取所述当前时刻各实体的时序表征,并基于所述当前时刻各实体的时序表征,构建所述当前时刻的知识图谱。
[0041]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的动态知识图谱预测方法。
[0042本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种动态知识图谱预测方法,其特征在于,包括:获取历史事件语料;将所述历史事件语料输入至图谱构建模型,得到所述图谱构建模型输出的当前时刻的知识图谱;其中,所述图谱构建模型包括结构编码器、隐含关系提取模块、关系编码模块和实体时序表征模块,所述图谱构建模型基于事件语料样本训练得到;所述结构编码器用于提取所述历史事件语料中每一历史时刻的各实体和各实体之间的关系信息,基于所述各实体和所述关系信息,确定每一历史时刻的知识图谱,并对每一历史时刻的知识图谱进行结构编码,得到每一历史时刻的各实体的特征表达;所述隐含关系提取模块用于基于每一历史时刻的各实体的特征表达,计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系,并基于所述第一关联关系和所述第二关联关系,构建实体关联关系图;所述关系编码模块用于对所述实体关联关系图进行编码,得到所述实体关联关系图中各实体的邻居表征;所述实体时序表征模块用于基于每一历史时刻的各实体的特征表达和所述实体关联关系图中各实体的邻居表征,提取所述当前时刻各实体的时序表征,并基于所述当前时刻各实体的时序表征,构建所述当前时刻的知识图谱。2.根据权利要求1所述的动态知识图谱预测方法,其特征在于,基于每一历史时刻的各实体的特征表达,计算每一历史时刻的各实体之间的第一关联关系和任意两个历史时刻的各实体之间的第二关联关系,包括:基于每一历史时刻的各实体的特征表达,计算每一历史时刻不存在所述关系信息的每两个实体之间的第一关联关系和任意两个历史时刻不存在所述关系信息的每两个实体之间的第二关联关系。3.根据权利要求1所述的动态知识图谱预测方法,其特征在于,基于所述第一关联关系和所述第二关联关系,构建实体关联关系图,包括:对所述第一关联关系进行稀疏化操作,得到第一稀疏化操作结果;对所述第二关联关系进行稀疏化操作,得到第二稀疏化操作结果;基于所述第一稀疏化操作结果和所述第二稀疏化操作结果,构建所述实体关联关系图。4.根据权利要求1所述的动态知识图谱预测方法,其特征在于,所述关系编码模块为基于注意力机制的关系型图神经网络;对所述实体关联关系图进行编码,得到所述实体关联关系图中各实体的邻居表征,包括:计算所述实体关联关系图中相邻实体之间的注意力系数;基于所述注意力系数,聚合所述实体关联关系图中各实体之间的关系表征,得到所述实体关联关系图中各实体的邻居表征。5.根据权利要求1
‑
4中任一项所述的动态知识图谱预测方法,其特征在于,所述时序表征包括全局时序表征和局部时序表征;基于每一历史时刻的各实体的特征表达和所述实体关联关系图中各实体的邻居表征,
提取所述当前时刻各实体的时序表征,包括:...
【专利技术属性】
技术研发人员:吴书,刘强,王亮,张孟奇,陈丹丹,徐辉杰,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。