一种多粒度时序知识图谱问答方法、装置及存储介质制造方法及图纸

技术编号：41291436 阅读：2 留言：0更新日期：2024-05-13 14:42

本发明专利技术公开了一种多粒度时序知识图谱问答方法、装置及存储介质，属于自然语言处理技术领域，所述方法包括：根据多粒度时序知识图谱构建时序超图，并引入非均匀对偶时序超图嵌入构建静态超图嵌入，基于所述静态超图嵌入得到时序超图嵌入表示；获取多粒度时序知识图谱中自然语言问题的语义表示，并基于所述语义表示得到时序问题表示；对所述时序问题表示以及历史路径进行编码得到历史路径编码，并基于所述历史路径编码得到所述推理路径上的下一跳节点；对完整推理路径中的推理链进行抽取与评估，并引导Agent进行积极的路径探索，通过刻画实体间的高阶关系，捕捉实体间的复杂语义变化，从而进行精准和高效的多粒度时序知识图谱问答。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种多粒度时序知识图谱问答方法、装置及存储介质，属于自然语言处理。

技术介绍

1、时序知识图谱是在知识图谱的基础上的一种扩展，即在表示事实的三元组中加入时间戳构成四元组，为每个事实赋予一个具体的时间，进而更加真实地刻画现实。在当前人工智能领域，多粒度时序知识图谱问答是一个重要的任务，它涉及了对知识图谱中的时序信息进行推理并通过关联问句与图谱中的已知事实，实现问句的回答。

2、然而，针对以往的研究往往关注的时序知识图谱问答是以年为时间跨度的大小，这种简化不太实用，因为现实世界中的问题和知识并不局限于几年的时间范围，而是多粒度的，即存在年、月、日多个粒度。因此针对多粒度时序知识图谱问答任务，随着时间粒度的增加，也会增加了问题语义复杂性，传统的tkg嵌入方法仅考虑低阶成对关系，而忽略了实体之间的高阶关系，导致嵌入结果欠佳，忽略了问题与路径之间的语义关联。

技术实现思路

1、本专利技术在于提供一种多粒度时序知识图谱问答方法、装置及存储介质，构建时序超图捕捉实体间的复杂语义变化，并通过时序语义表示更好地表达问题实体之间更复杂的关系，塑造奖励引导agent进行有效路径探索，提高了知识图谱问答过程中对给定的多粒度时序问题及其同类问题的理解和准确回答能力。

2、为达到上述目的，本专利技术是采用下述技术方案实现的。

3、第一方面，本专利技术提供一种多粒度时序知识图谱问答方法，包括：

4、获取多粒度时序知识图谱；

5、根据所述多

6、通过预先训练的语言模型获取所述多粒度时序知识图谱中自然语言问题的语义表示，并基于所述语义表示得到时序问题表示；

7、获取所述多粒度知识图谱上针对所述时序问题的历史路径，对所述时序问题表示以及历史路径进行编码得到历史路径编码，并基于所述历史路径编码以及时序超图嵌入表示得到所述推理路径上的下一跳节点，直至完成一次完整的路径推理；

8、对完整推理路径中的推理链进行抽取与评估，并引导agent继续探索推理链语义表示与所述时序问题语义表示相似度高的推理路径，其中，所述推理链为推理路径中所有关系的有序列表。

9、可选地，所述根据所述多粒度时序知识图谱构建时序超图，并引入非均匀对偶时序超图嵌入构建静态超图嵌入，基于所述静态超图嵌入得到时序超图嵌入表示，包括：

10、对所述多粒度时序知识图谱数据集进行预处理，构建时序超图，所述时序超图表示为thg＝(v,e)，其中v表示所有节点的集合，e表示所有边的集合，ξrt为超边，一个超边为一个关系r与时间戳t的组合，rt表示关系r与时间戳t组合的个数，超边ξrt表示为(r,e1,e2,...ei,t)；

11、通过关联矩阵hhead、htail对所述超边ξrt中的实体ei进行标记，所述关联矩阵hhead、htail的表示形式如下：

12、

13、其中，ξjtail表示超边尾实体，ξjhead表示超边头实体，j∈rt，i∈i表示超边中e的数量；

14、将对偶非均匀超图网络dhne与所述关联矩阵hhead、htail拼接，得到时序超图嵌入的静态表示部分

15、

16、其中，为时序超图嵌入的静态表示部分的可学习矩阵；

17、为超边的时间戳t设定时间特征矩阵ft、dt，利用实体所在超边的时序信息差异获取所述实体在特定时间戳下的动态表示部分，ft表示当前时间戳出现的频率，dt表示当前时间戳出现的频率权重；

18、将实体的静态表示以及动态表示进行拼接，得到实体ei的时序超图嵌入表示：

19、

20、可选地，所述通过预先训练的语言模型获取所述多粒度时序知识图谱中自然语言问题的语义表示，并基于所述语义表示得到时序问题表示，包括：

21、将自然语言问题qtext输入预先训练的语言模型roberta，得到问题语义表示qs，qs＝wsroberta(qtext)，qs＝[qs1,qs2,...,qsn]，其中，ws表示d×droberta的可学习矩阵，d表示tkg嵌入的维度，droberta表示roberta的嵌入维度，roberta()表示nlp处理模块，qtext表示时序问题的文本信息；

22、对所述语义表示qs中的时间约束词进行分类和编码，得到时间信号编码tse；

23、将所述问题语义表示qs和时间信号编码tse进行拼接以及编码，得到时序问题表示q，

24、qt＝transformer([qs；tse])，

25、其中，[；]表示拼接操作，qt表示编码后的时序问题表示矩阵，将矩阵qt中的元素qcls作为时序问题表示q，cls表示自然语言问题的标志位。

26、可选地，所述获取所述多粒度知识图谱上针对所述时序问题的历史路径，对所述时序问题表示以及历史路径进行编码得到历史路径编码，并基于所述历史路径编码以及时序超图嵌入表示得到所述推理路径上的下一跳节点，包括：

27、根据agent在所述多粒度时序知识图谱上针对所述时序问题进行推理的节点获取历史路径；

28、将历史路径与所述时序问题表示q输入bi-lstm，得到历史路径编码；

29、构建策略网络π(a*|s)，其中，s为状态信息，当前状态信息si＝(ei,ti,eq,tq,hl)，a*为动作信息，当前所选动作信息ai表示当前推理步所有候选动作集合，ei表示当前实体，ti表示当前时间戳，eq表示时序问题中的实体，tq表示时序问题中的时间戳，hl表示第l步历史路径编码，表示当前所选的动作实体，表示当前所选的动作关系，表示当前所选的动作时间戳；

30、采用多层感知器对所述当前状态信息si进行编码，得到当前候选动作信息，所述候选动作信息计算公式如下：

31、

32、

33、

34、其中，表示期望目标动作，表示期望目标关系，表示期望目标时间，是d×d维的目标节点可学习矩阵，是d×d维的目标边可学习矩阵，是d×d维的目标边可学习矩阵，w1表示输出期望目标的可学习矩阵；

35、基于所述候选动作信息得到所述推理路径上的下一跳节点。

36、可选地，所述基于所述候选动作信息得到所述推理路径上的下一跳节点，包括：

37、通过所述候选动作信息进行加权计算，得到候选动作分数所述候选动作分数计算公式如下：

38、

39、其中，α、β、χ是控制因子权重的超参数，α∈(0，1)、β∈(0，1)、χ∈(0，1)；

40、根据所述候选动作分数选择下一跳节点。

41、可选地，所述对完整推理路径中的推理链进行抽取与评估，并引导agent继续探索推理链语义表示与所述时序问题语义表示相似度高的推本文档来自技高网...

【技术保护点】

1.一种多粒度时序知识图谱问答方法，其特征在于，包括：

2.根据权利要求1所述的多粒度时序知识图谱问答方法，其特征在于，所述根据所述多粒度时序知识图谱构建时序超图，并引入非均匀对偶时序超图嵌入构建静态超图嵌入，基于所述静态超图嵌入得到时序超图嵌入表示，包括：

3.根据权利要求2所述的多粒度时序知识图谱问答方法，其特征在于，所述通过预先训练的语言模型获取所述多粒度时序知识图谱中自然语言问题的语义表示，并基于所述语义表示得到时序问题表示，包括：

4.根据权利要求3所述的多粒度时序知识图谱问答方法，其特征在于，所述获取所述多粒度知识图谱上针对所述时序问题的历史路径，对所述时序问题表示以及历史路径进行编码得到历史路径编码，并基于所述历史路径编码以及时序超图嵌入表示得到所述推理路径上的下一跳节点，包括：

5.根据权利要求4所述的多粒度时序知识图谱问答方法，其特征在于，所述基于所述候选动作信息得到所述推理路径上的下一跳节点，包括：

6.根据权利要求5所述的多粒度时序知识图谱问答方法，其特征在于，所述对完整推理路径中的推理链进行抽取与

7.根据权利要求6所述的多粒度时序知识图谱问答方法，其特征在于，所述基于相关性计算结果对推理规则进行奖励塑造，引导Agent继续探索推理链语义表示与所述时序问题语义表示相似度高的推理路径，包括：

8.一种多粒度时序知识图谱问答装置，其特征在于，包括：

9.一种计算机存储介质，其上存储有计算机程序，其特征在于，该计算机程序被处理器执行时，实现如权利要求1-7中任一项所述的多粒度时序知识图谱问答方法。

...

【技术特征摘要】

1.一种多粒度时序知识图谱问答方法，其特征在于，包括：

5.根据权...

【专利技术属性】
技术研发人员：朱玉，马廷准，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人