System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于层次化图注意力机制的知识图谱补全方法技术_技高网

一种基于层次化图注意力机制的知识图谱补全方法技术

技术编号:40528521 阅读:6 留言:0更新日期:2024-03-01 13:48
本发明专利技术公开了一种基于层次化图注意力机制的知识图谱补全方法,先将知识图谱中的各实体映射到高维特征空间,然后计算相邻实体在特定关系连接情况下的注意力系数,通过注意力系数计算多头注意力机制下的实体特征向量,接着将关系特征嵌入至每个实体的特征向量,再进行实体和关系的更新,最后根据更新后的实体和关系进行知识图谱的补全操作。

【技术实现步骤摘要】

本专利技术属于知识图谱,更为具体地讲,涉及一种基于层次化图注意力机制的知识图谱补全方法


技术介绍

1、知识图谱(kgs)正在逐渐成为与人工智能相关应用的重要资源之一。许多大规模的知识图谱,如freebase、wordnet、yago等,已被证明对于问题回答系统、推荐系统和信息检索系统具有深远的影响。知识图谱中的知识通常以三元组(h,r,t)的形式建模,其中h和t分别表示头实体和尾实体,r指代连接头实体和尾实体的关系信息。因此,知识图谱可以建模大量的知识,并且这一属性使得知识图谱在各个领域都能够取得成功。

2、尽管知识图谱在许多领域取得了成功,但现实世界中的大多数知识图谱都存在不完整和嘈杂的信息。最近,许多研究开始研究知识图谱的补全。具体而言,知识补全的任务是在给定查询(?,r,t)的情况下预测头实体,或在给定查询(h,r,?)的情况下预测尾实体。

3、最近在知识图谱补全研究中取得的进展主要集中在知识图谱嵌入方面。这些模型的基本思想是学习实体和关系的潜在低维表示,同时捕捉它们的语义含义;这样学习到的嵌入可以保留知识图谱的结构信息。然后,该模型使用相应的表示基于神经网络方法预测缺失的实体。然而,这些方法主要集中于三元组独立地处理,而没有太多关注可能包含它们之间固有结构和语义信息的邻近实体。

4、在大多数情况下,知识图谱是一个包含多种关系类型的异构图。如图1所示,一个实体周围有一些实体和几种不同的关系。关系反映了参与的电影,而表示合作伙伴。显然,这些关系可以传递不同的语义信息,并对中心实体产生不同的影响;因此,将这些关系平等对待是不合适的。相反,我们应该有选择地对这些关系分配不同的注意力。

5、近年来,深度学习的一个研究趋势是注意力机制,它鼓励模型关注最有价值的特征。它已经证明在深度学习中非常有效,被广泛应用于各个领域。图注意力网络(gat)是一种图神经网络,已经被证明在图结构数据中取得了最新的研究成果,通过学习为每个节点在其邻居中分配不同的重要性。尽管gat在图结构数据方面取得了成功,但它并没有考虑多关系异构图的情况,因此不适合直接用于知识图谱任务。


技术实现思路

1、本专利技术的目的在于克服现有技术的不足,提供一种基于层次化图注意力机制的知识图谱补全方法,基于改进的层次化图注意力机制实现知识图谱三元组的高效补全。

2、为实现上述专利技术目的,本专利技术一种基于层次化图注意力的知识图谱补全方法,其特征在于,包括以下步骤:

3、(1)、实体预处理;

4、设知识图谱中的实体集合为h={h1,h2,…,hi,…,hn},hi表示第i个实体,n为实体的个数;

5、将每个实体映射到高维特征空间,即:w0为特征变换矩阵;

6、(2)、计算任意两个相邻实体在关系r连接情况下的注意力系数

7、

8、其中,i≠j,i,j∈[1,n],a为权重向量,上标t表示转置;

9、(3)、采用多头注意力机制计算每个实体的特征向量;

10、(3.1)、在单头注意力机制模块中,遍历实体集合中的每个实体,以实体i为基准,在实体集合中找到与实体i通过关系r相连的所有实体,并储存在实体集合

11、根据实体i与相连的相邻实体j的注意力系数,计算单头注意力机制下实体i的特征向量

12、

13、(3.2)、计算多头注意力机制下实体i的特征向量

14、

15、其中,k为多头注意力机制的数量;

16、(4)、将关系特征嵌入至每个实体的特征向量;

17、(4.1)、给定关系特征嵌入向量rrel={r1,r2,…,rτ,…,rr},其中,rτ表示第τ类关系的特征向量表示,r表示关系的类型总数;

18、(4.2)、基于rrel利用全局最大池化maxpool操作和全局均匀池化avgpool操作对进行特征压缩和提取,然后将二者相加从而得到实体i周围邻域实体的全局压缩特征fir;

19、

20、(4.3)、采用门控机制计算实体i的周围邻接关系rτ相对于实体i的重要性程度

21、

22、其中,σ[]表示sigmoid激活函数,w1,w2表示权重向量;

23、(4.4)、基于实体i周围邻接关系的重要性程度,对实体i周围所有邻居实体进行特征聚合;

24、

25、其中,表示在实体集合中找到与实体i通过关系rτ相连的所有实体的集合;

26、(4.5)、将聚合后的特征与实体i本身进行叠加融合,得到实体i的注意力特征;

27、

28、其中,w3为特征变换矩阵;

29、(4.6)、将实体i的注意力特征与实体i初始表示进行叠加融合;

30、

31、其中,w4为特征变换矩阵;

32、(5)、对关系特征嵌入向量进行更新;

33、

34、其中,w5为特征变换矩阵;

35、(6)、知识图谱补全;

36、(6.1)、以实体i为基准,将作为头实体,并选择与相连的关系然后实体集合中为头实体的尾实体尾实体是不能为且不能与有直接关系连接的实体,从而组成多个候选三元组

37、(6.2)、为每个候选三元组进行预测打分;

38、

39、其中,表示候选三元组的预测打分,表示头实体和关系进行二维重塑后的结果,“||”表示向量拼接,“*”代表卷积操作,vec()表示向量化操作,q表示权重矩阵,w6表示特征变换矩阵;

40、(6.3)、选出预测打分最高的三元组补全到知识图谱中;

41、(6.4)、遍历实体集合中每个实体,按照步骤(6.1)~(6.3)的方法进行知识图谱补全。

42、本专利技术的专利技术目的是这样实现的:

43、本专利技术一种基于层次化图注意力机制的知识图谱补全方法,先将知识图谱中的各实体映射到高维特征空间,然后计算相邻实体在特定关系连接情况下的注意力系数,通过注意力系数计算多头注意力机制下的实体特征向量,接着将关系特征嵌入至每个实体的特征向量,再进行实体和关系的更新,最后根据更新后的实体和关系进行知识图谱的补全操作。

44、同时,本专利技术一种基于层次化图注意力机制的知识图谱补全方法还具有以下有益效果:

45、(1)、分层注意力机制可以同时考虑实体和关系的重要性,并为模型提供更细粒度的特征提取,从而增加了学习过程的解释性。

46、(2)、将计算机视觉中的通道注意力计算思路引入到关系注意力机制中,可以很好的提升关系的特征信息提取,并且能够重复考虑到关系和实体之间的相关性。

本文档来自技高网...

【技术保护点】

1.一种面向雷达的实体关系联合抽取方法,其特征在于,包括以下步骤:

【技术特征摘要】

1.一种面向雷达的实体关系联合抽取...

【专利技术属性】
技术研发人员:王丽军徐晶徐杰何欢谢豪雕贺媛媛旷生玉李高云
申请(专利权)人:电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1