System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于知识图谱,具体涉及一种神经符号结合的知识图谱推理方法。
技术介绍
1、知识图谱(knowledge graph)是一种表示真实世界的结构化方法。知识图谱,如family、umls、kinship和wn-18rr,由表示实体的节点和表示实体之间关系的边组成。知识图谱由三元组组成,三元组的形式是(头实体,关系,尾实体)。但是由于知识提取算法的缺陷,现有的知识图谱往往是不完整的。知识图谱推理通过从现有事实中进行推理来预测遗漏的事实,已成为人工智能领域的一个热门研究领域。
2、知识图谱推理的主要方法包括基于嵌入的方法和基于规则的方法。其中,基于嵌入的方法将实体或关系嵌入到向量空间中,并寻求最合适的语义表示,如何挖掘更深语义成为基于嵌入的方法主要探究的目标。基于规则的方法从符号逻辑开始,这体现了可解释性,但由于搜索空间大,它们在大型数据集上的有效性有限。近年来,研究人员对神经符号相结合的方法不断探索,其中,规则学习方法尤其出色,因为它们一方面由于应用了深度学习技术具有出色的性能,另一方面又利用到符号逻辑推理具有可解释性。
3、尽管深度学习虽然在性能方面表现出强大的能力,但是其黑盒特性使得其在军事、医疗等安全性要求较高的领域发展受阻。知识图谱本身对数据质量的高要求又制约了符号逻辑推理的发展,因此需要探索一种高效利用知识图谱已有知识,并具备一定可解释性的神经符号结合的知识图谱推理方法。
技术实现思路
1、针对现有技术中的上述不足,本专利技术提供的神经符合结合
2、为了达到上述专利技术目的,本专利技术采用的技术方案为:一种神经符号结合的知识图谱推理方法,包括以下步骤:
3、s1、丰富待推理知识图谱的语义,确定其融合内在相关语义中的关系嵌入;
4、s2、在待推理知识图谱上基于随机游走策略采样指定长度的闭合路径,进而构建可能规则集;
5、s3、利用位置嵌入和语义学习器学习可能规则集中每一条规则体的语义;
6、s4、基于可能规则集中规则头和规则体的语义一致性,评估每条可能规则,并筛选出高置信度规则;
7、s5、根据筛选出的规则进行知识图谱推理。
8、进一步地,所述步骤s1具体为:
9、s11、提取待推理知识图谱中三元组的所有关系,对其进行去重处理得到关系集合
10、s12、对关系集合中的每个关系嵌入,得到待推理知识图谱的关系初始嵌入矩阵εr;
11、s13、分析关系集合中的每个关系的活跃度s(qi,k),并进行关系活跃度排序;
12、s14、根据关系活跃度排序结果,使用交叉注意力机制确定每个关系对应的最重要关系,并确定其概率分布矩阵θ;
13、s15、将概率分布矩阵θ与关系初始嵌入矩阵相乘εr,得到待推理知识图谱中融合内在相关语义中的关系嵌入e′r。
14、进一步地,所述步骤s13具体为:
15、s13-1、随机从关系集合采样alnlk个关系作为自注意力机制的键矩阵k;
16、其中,所述自注意力机制的矩阵包括查询矩阵q、键矩阵k和值矩阵v;
17、s13-2、将键矩阵k与所有关系组成查询矩阵q内积,得到alnlk个采样关系中权重最大的值,并减去平均值进而确定每条关系活跃度得分;
18、s13-3、根据各条关系的活跃度进行排序,并选择活跃度得分最高的alnlk个关系作为更新关系嵌入时使用的自注意力机制的查询矩阵q;
19、所述步骤s14中,在确定每个关系对应的最重要关系时,使用交叉注意力机制,对筛选出的alnlk个活跃关系更新,对剩余关系采用平均处理。
20、进一步地,所述步骤s2具体为:
21、s21、选定待推理知识图谱中的n个三元组t=(h,r,t)作为锚点三元组;其中,h为头实体,r为路径,t为尾实体;
22、s22、设置规则最大游走长度为m,对于每一个锚点三元组,采用随机游走策略,从头实体h出发,将在最大游走长度之前到到达尾实体t形成的闭合路径作为规则体rb,将该锚点三元组作为规则头rh,并将其加入至可能规则集
23、其中,x为锚点三元组的头实体,y为锚点三元组的尾实体,z1为从头实体开始,使用随机游走策略经过某关系能到达第一个实体,下标n表示从头实体开始随机游走策略的跳数,即关系路径或规则体的长度。
24、进一步地,所述步骤s3具体为:
25、s31、对可能规则集中的每一条规则体rb中每一条关系的位置编码,得到规则体的位置嵌入ep,并将其与该规则体的关系嵌入表示相加得到融入位置编码的该规则体的关系嵌入
26、s32、基于通过语义学习器对规则体进行多轮语义学习,得到每一条规则体的语义表示
27、进一步地,所述步骤s32中,所述语义学习器包括nlayer个相同的语义学习层,每个语义学习层包括依次连接的前馈网络、多头交叉注意力机制和残差-归一化层;其中,nlayer的取值根据可能规则集中的可能规则长度确定。
28、进一步地,所述步骤s32中,通过语义学习器对规则体进行多轮语义学习的方法具体为:
29、s32-1、在当前轮次中,将规则体中两个相邻的关系通过前馈网络处理,得到两个相邻关系的嵌入向量作为多头交叉注意力机制的查询矩阵q;
30、s32-2、将规则体中的所有关系作为键矩阵k,使用多头交叉注意力机制查询规则体语义上最接近的关系,得到一个注意力权重矩阵
31、s32-3、将多头交叉注意力机制的注意力权重矩阵与所有关系嵌入表示e′r相乘,得到两个相邻关系的新一轮嵌入表示
32、s32-4、将与相加,并通过残差-归一化层处理得到作为下一轮规则体语义学习时规则体中两个相邻的关系之一;
33、s32-5、基于步骤s32-1~s32-5,通过语义学习器对规则体进行多轮语义学习,得到每一条规则体的语义表示
34、进一步地,所述步骤s4具体为:
35、s41、将学习到的规则体语义映射到独热向量vrh;
36、s42、根据映射的独热向量vrh,通过规则体最大化分数目标函数对可能规则进行评估;
37、s43、按照置信度对评估结果进行排序,并对每个关系取前k个规则作为筛选出的高置信度规则。
38、进一步地,所述步骤s42中,规则体最大化分数目标函数表示为:
39、
40、式中,表示给定的一组采样路径,表示采样路径z的学习得到的注意力,|r|表示关系的总数。
41、本专利技术的有益效果为:
42、(1)本专利技术通过允许关系相互感知并注意逻辑序列敏感性本文档来自技高网...
【技术保护点】
1.一种神经符号结合的知识图谱推理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S1具体为:
3.根据权利要求2所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S13具体为:
4.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S2具体为:
5.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S3具体为:
6.根据权利要求5所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S32中,所述语义学习器包括Nlayer个相同的语义学习层,每个语义学习层包括依次连接的前馈网络、多头交叉注意力机制和残差-归一化层;其中,Nlayer的取值根据可能规则集中的可能规则长度确定。
7.根据权利要求6所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S32中,通过语义学习器对规则体进行多轮语义学习的方法具体为:
8.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,
9.根据权利要求8所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤S42中,规则体最大化分数目标函数表示为:
...【技术特征摘要】
1.一种神经符号结合的知识图谱推理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤s1具体为:
3.根据权利要求2所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤s13具体为:
4.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤s2具体为:
5.根据权利要求1所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤s3具体为:
6.根据权利要求5所述的神经符号结合的知识图谱推理方法,其特征在于,所述步骤s32中...
【专利技术属性】
技术研发人员:田玲,何岳峰,加明,潘家舟,郑旭,高辉,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。