System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种实体对齐方法技术_技高网

一种实体对齐方法技术

技术编号:41063589 阅读:15 留言:0更新日期:2024-04-24 11:16
本发明专利技术属于人工智能技术领域,具体涉及一种实体对齐方法。对两个知识图谱进行表示学习获得对应的向量,再引入投影矩阵对向量进行映射得到优化后的向量,将优化后的向量进行余弦相似度计算得到相似度矩阵,然后基于迭代的方法对两个知识图谱的实体进行实体匹配,最终获得更加精准的等价实体对,从而实现了不同知识图谱之间信息的有效融合和整合。

【技术实现步骤摘要】

本专利技术属于人工智能,具体涉及一种实体对齐方法


技术介绍

1、在当前的知识图谱和数据库管理领域中,实体对齐技术是实现不同数据源之间信息共享和融合的关键环节。然而,现有技术存在着一些局限性,例如基于规则的方法需要人工定义规则,难以应对知识图谱规模庞大、多样性和复杂性的挑战;而基于传统机器学习的方法则受限于特征工程和维度灾难,难以捕捉实体之间的复杂语义关联。此外,部分方法在实体匹配过程中缺乏全局优化策略,容易导致匹配精度不高或易受噪声干扰。因此需要一种新的实体对齐方法,以有效识别并匹配出跨知识图谱的等价实体,从而实现不同知识图谱之间信息的有效融合和整合。


技术实现思路

1、本专利技术的目的在于提供一种实体对齐方法,对两个知识图谱进行表示学习获得对应的向量,再引入投影矩阵对向量进行映射得到优化后的向量,将优化后的向量进行余弦相似度计算得到相似度矩阵,然后基于迭代的方法对两个知识图谱的实体进行实体匹配,最终获得更加精准的等价实体对,从而实现了不同知识图谱之间信息的有效融合和整合。

2、为实现以上目的,本专利技术采用以下技术方案:

3、第一方面,本专利技术提供一种实体对齐方法,包括步骤:

4、s1、分别对知识图谱1和知识图谱2进行表示学习,得到知识图谱1的实体向量、实体间关系向量,知识图谱2的实体向量、实体间关系向量;

5、s2、构建知识图谱1的实体投影矩阵、实体间关系投影矩阵,用知识图谱1的实体投影矩阵对知识图谱1的实体向量进行映射,用知识图谱1的实体间关系投影矩阵对知识图谱1的实体间关系向量进行映射,以得到映射优化后知识图谱1的实体向量、实体间关系向量,并整合得到知识图谱1的实体向量集合a;用同样的方法得到知识图谱2的实体向量、实体间关系向量,并整合得到知识图谱2的实体向量集合b;

6、s3、用余弦相似度计算方法对知识图谱1的实体向量集合a、知识图谱2的实体向量集合b进行计算,得到知识图谱1中的实体与知识图谱2中的实体之间的相似度矩阵;

7、s4、基于相似度矩阵对知识图谱1中的实体与知识图谱2中的实体进行匹配,不断迭代以筛选得到两个知识图谱的等价实体对集合。

8、作为优选方案,步骤s1中用transe模型分别对知识图谱1和知识图谱2进行表示学习,知识图谱1表示为kg1=(e1,r1,p1,t1),知识图谱2表示为kg2=(e2,r2,p2,t)2;

9、其中e1、e2分别表示知识图谱1、2的实体集合;r1、r2分别表示知识图谱1、2的实体间关系集合;p1、p2分别表示知识图谱1、2的实体类型集合;t1、t2分别表示知识图谱1、2的三元组集合,三元组表示为(h,r,t),h表示头实体,t表示尾实体,r表示头实体与尾实体之间的关系即实体间关系;

10、且通过transe模型使知识图谱1、2的头实体向量、尾实体向量、头实体与尾实体之间的关系向量均满足以下关系:h+r≈t,其中h表示头实体向量,r表示头实体与尾实体之间的关系向量即实体间关系向量,t表示尾实体向量。

11、作为优选方案,步骤s2包括:

12、s2.1、构建知识图谱1的各实体类型的投影矩阵、头实体投影矩阵、尾实体投影矩阵,并用构建的投影矩阵对知识图谱1的头实体向量、尾实体向量进行映射,得到映射后的知识图谱1的头实体向量、尾实体向量;

13、s2.2、构建知识图谱1的实体间关系投影矩阵,并用构建的投影矩阵对知识图谱1的实体间关系向量进行映射,得到映射后的知识图谱1的实体间关系向量,且使映射后的知识图谱1的头实体向量、尾实体向量、实体间关系向量满足以下关系:hp+rp≈tp,其中hp表示映射后的头实体向量,rp表示映射后的实体间关系向量,tp表示映射后的尾实体向量,并整合得到知识图谱1的实体向量集合a;

14、对知识图谱2进行与上述知识图谱1相同的处理,得到映射后的知识图谱2的头实体向量、尾实体向量、实体间关系向量,并整合得到知识图谱2的实体向量集合b。

15、作为优选方案,步骤s2.1中,头实体投影矩阵基于头实体类型集合构建得到,尾实体投影矩阵基于尾实体类型集合构建得到。

16、作为优选方案,构建头实体投影矩阵、尾实体投影矩阵时均采用重要性权重对头、尾实体类型进行约束。

17、作为优选方案,步骤2.2中,考虑到不同关系在知识图谱中的重要性不同,采用比例递减加权策略来构建实体间关系投影矩阵。

18、作为优选方案,步骤s4包括:

19、s4.1、基于知识图谱1的实体向量集合a、知识图谱2的实体向量集合b构建两个知识图谱的等价实体对集合ψ,并将等价实体对集合ψ初始化为一个φ,同时初始化一个范围合集z,范围合集z中包括一定数量的整数;

20、s4.2、从范围集合z中取出一个整数z,根据相似度矩阵找到相似度最高的实体对,将找到的实体对放入等价实体对集合ψ中,并更新相似度矩阵以及范围合集z;

21、s4.3、判断范围合集z是否为φ,若是,则完成对两个知识图谱的实体的匹配得到两个知识图谱的等价实体对集合,并进入步骤s4.5,若否则重复步骤s4.2;

22、s4.4、根据预设的相似度阈值对两个知识图谱的等价实体对集合中的等价实体对进行筛选,以得到最终的等价实体对集合

23、作为优选方案,步骤s4.2中,根据相似度矩阵找到相似度最高的实体对的具体步骤为:

24、a)从范围集合z中取出一个整数z,在相似度矩阵的第z行中找到最大值,并将第z行的最大值所在列记为yn;

25、b)在相似度矩阵的第yn列中找到最大值,并将第yn列的最大值所在行记为xn,如果整数z等于xn,则表示找到相似度最高的实体对,(xn,yn)即为相似度最高的实体对。

26、第二方面,本专利技术提供一种实体对齐装置,包括存储器、一个或多个处理器、存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如上述所述的方法。

27、第三方面,本专利技术提供一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述所述的方法。

28、本专利技术的有益效果是:

29、对两个知识图谱进行表示学习获得对应的向量,再引入投影矩阵对向量进行映射得到优化后的向量,将优化后的向量进行余弦相似度计算得到相似度矩阵,然后基于迭代的方法对两个知识图谱的实体进行实体匹配,最终获得更加精准的等价实体对,以实现不同知识图谱之间的实体对齐,实现了不同知识图谱之间信息的有效融合和整合。

30、本专利技术在构建投影矩阵时,引入了实体类型约束及实体间关系信息约束,使知识图谱实体对齐的结果更加精准。同时本专利技术所述的方法有较高的灵活性和通用性,适用于多个领域的知识图谱实体对齐,为知识图谱的融合提供了高效可靠的解决方案。

本文档来自技高网...

【技术保护点】

1.一种实体对齐方法,其特征在于,包括步骤:

2.根据权利要求1所述的一种实体对齐方法,其特征在于,步骤S1中用TransE模型分别对知识图谱1和知识图谱2进行表示学习,知识图谱1表示为KG1=(E1,R1,P1,T1),知识图谱2表示为KG2=(E2,R2,P2,T2);

3.根据权利要求2所述的一种实体对齐方法,其特征在于,步骤S2包括:

4.根据权利要求3所述的一种实体对齐方法,其特征在于,步骤S2.1中,头实体投影矩阵基于头实体类型集合构建得到,尾实体投影矩阵基于尾实体类型集合构建得到。

5.根据权利要求4所述的一种实体对齐方法,其特征在于,构建头实体投影矩阵、尾实体投影矩阵时均采用重要性权重对头、尾实体类型进行约束。

6.根据权利要求3所述的一种实体对齐方法,其特征在于,步骤2.2中,考虑到不同关系在知识图谱中的重要性不同,采用比例递减加权策略来构建实体间关系投影矩阵。

7.根据权利要求1所述的一种实体对齐方法,其特征在于,步骤S4包括:

8.根据权利要求7所述的一种实体对齐方法,其特征在于,步骤S4.2中,根据相似度矩阵找到相似度最高的实体对的具体步骤为:

9.一种实体对齐装置,其特征在于,包括存储器、一个或多个处理器、存储在所述存储器中并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至8任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的方法。

...

【技术特征摘要】

1.一种实体对齐方法,其特征在于,包括步骤:

2.根据权利要求1所述的一种实体对齐方法,其特征在于,步骤s1中用transe模型分别对知识图谱1和知识图谱2进行表示学习,知识图谱1表示为kg1=(e1,r1,p1,t1),知识图谱2表示为kg2=(e2,r2,p2,t2);

3.根据权利要求2所述的一种实体对齐方法,其特征在于,步骤s2包括:

4.根据权利要求3所述的一种实体对齐方法,其特征在于,步骤s2.1中,头实体投影矩阵基于头实体类型集合构建得到,尾实体投影矩阵基于尾实体类型集合构建得到。

5.根据权利要求4所述的一种实体对齐方法,其特征在于,构建头实体投影矩阵、尾实体投影矩阵时均采用重要性权重对头、尾实体类型进行约束。

6.根据权利要求3所...

【专利技术属性】
技术研发人员:陆烨辉季白杨
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1