System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于实体对齐的方法和装置制造方法及图纸_技高网

用于实体对齐的方法和装置制造方法及图纸

技术编号:42735958 阅读:12 留言:0更新日期:2024-09-18 13:31
本公开内容提供了一种用于实体对齐的计算机实现的方法。该计算机实现的方法包括:基于预训练的模型,获得第一图谱(101)的实体的第一多个初始嵌入和第二图谱(102)的实体的第二多个初始嵌入,其中第一多个初始嵌入和第二多个初始嵌入在统一空间(201)中;以及由至少一个编码器使用相对相似度度量将非对齐的实体推远来在第一多个初始嵌入和第二多个初始嵌入上学习第一图谱(101)和第二图谱(102)之间的实体对齐,其中在学习期间在第一图谱(101)或第二图谱(102)中的一个图谱上,对第一图谱(101)或第二图谱(102)中的该图谱的实体的非对齐实体执行负采样。

【技术实现步骤摘要】
【国外来华专利技术】

概括地说,本公开内容的各方面涉及人工智能,具体地说,本公开内容的各方面涉及用于不同知识图谱之间的实体对齐的方法和装置。


技术介绍

1、知识图谱(kg)已被广泛地应用于诸如搜索、推荐和问答等等之类的各种web应用。构建大规模kg是一项具有挑战性的任务。虽然可以从头开始提取新的事实,但对齐现有的不完整的kg以相互补充实际上是必要的,这涉及到实体对齐,也被称为本体映射、模式匹配或实体链接。实体对齐旨在识别不同kg之间的等同实体,并在kg构建和融合中发挥着基础性作用。

2、最近,基于深度表示学习的对齐方法已成为实体对齐的主流解决方案,其中的关键思想是学习kg的向量表示(即,嵌入),并根据嵌入的相似性来识别实体对齐。然而,这些方法在很大程度上依赖于人类标注提供的监督信号,人类标注可能是有偏差的,并且对于网络规模的kg来说,进行人类标注的成本非常高。

3、因此,需要开发一种标记高效的实体对齐方法。


技术实现思路

1、为了对根据本公开内容的一个或多个方面有一个基本的理解,下面概括了这些方面的简化概括。该概括部分不是对所有预期方面的详尽概述,也不是旨在标识本公开内容的所有方面的关键或重要元素,或者描述任意或全部方面的范围。其唯一目的是用简化的形式呈现一个或多个方面的一些概念,以此作为后面的详细说明的前奏。

2、在本公开内容的一个方面,提供了一种用于实体对齐的计算机实现方法,该方法包括:基于预训练的模型,获得第一图谱的实体的第一多个初始嵌入和第二图谱的实体的第二多个初始嵌入,其中所述第一多个初始嵌入和所述第二多个初始嵌入在统一空间中;以及由至少一个编码器使用相对相似度度量将非对齐的实体推远来在所述第一多个初始嵌入和所述第二多个初始嵌入上学习所述第一图谱和所述第二图谱之间的实体对齐,其中在所述学习期间,在所述第一图谱或所述第二图谱中的一个图谱上,对所述第一图谱或所述第二图谱中的所述一个图谱的实体的非对齐实体执行负采样。

3、在本公开内容的另一个方面,提供了一种用于具有自然语言的图谱的实体对齐的计算机实现方法,该方法包括:基于预训练的语言模型,获得第一图谱的实体的第一多个初始嵌入和第二图谱的实体的第二多个初始嵌入,其中所述第一图谱和所述第二图谱包括相同或不同的语言,并且所述第一多个初始嵌入和所述第二多个初始嵌入在统一空间中;以及由至少一个编码器使用相对相似度度量将非对齐的实体推远来在所述第一多个初始嵌入和所述第二多个初始嵌入上学习所述第一图谱和所述第二图谱之间的实体对齐,其中在所述学习期间,在所述第一图谱或所述第二图谱中的一个图谱上,对所述第一图谱或所述第二图谱中的所述一个图谱的实体的非对齐实体执行负采样。

4、在本公开内容的另一个方面,提供了一种用于实体对齐的装置,该装置包括存储器和至少一个处理器。所述至少一个处理器可以被配置为:基于预训练的模型,获得第一图谱的实体的第一多个初始嵌入和第二图谱的实体的第二多个初始嵌入,其中所述第一多个初始嵌入和所述第二多个初始嵌入在统一空间中;以及由至少一个编码器使用相对相似度度量将非对齐的实体推远来在所述第一多个初始嵌入和所述第二多个初始嵌入上学习所述第一图谱和所述第二图谱之间的实体对齐,其中在所述学习期间,在所述第一图谱或所述第二图谱中的一个图谱上,对所述第一图谱或所述第二图谱中的所述一个图谱的实体的非对齐实体执行负采样。

5、在本公开内容的另一个方面,提供了一种包括有处理器可执行计算机代码的用于实体对齐的计算机程序产品。可以执行所述可执行计算机代码,以用于:基于预训练的模型,获得第一图谱的实体的第一多个初始嵌入和第二图谱的实体的第二多个初始嵌入,其中所述第一多个初始嵌入和所述第二多个初始嵌入在统一空间中;以及由至少一个编码器使用相对相似度度量将非对齐的实体推远来在所述第一多个初始嵌入和所述第二多个初始嵌入上学习所述第一图谱和所述第二图谱之间的实体对齐,其中在所述学习期间,在所述第一图谱或所述第二图谱中的一个图谱上,对所述第一图谱或所述第二图谱中的所述一个图谱的实体的非对齐实体执行负采样。

6、在本公开内容的另一个方面,提供了一种存储有用于实体对齐的计算机代码的计算机可读介质。当该计算机代码被处理器执行时,可以使得所述处理器执行以下操作:基于预训练的模型,获得第一图谱的实体的第一多个初始嵌入和第二图谱的实体的第二多个初始嵌入,其中所述第一多个初始嵌入和所述第二多个初始嵌入在统一空间中;以及由至少一个编码器使用相对相似度度量将非对齐的实体推远来在所述第一多个初始嵌入和所述第二多个初始嵌入上学习所述第一图谱和所述第二图谱之间的实体对齐,其中在所述学习期间,在所述第一图谱或所述第二图谱中的一个图谱上,对所述第一图谱或所述第二图谱中的所述一个图谱的实体的非对齐实体执行负采样。

7、通过仅将负样本推远并进行自负采样,本文提供的方法和装置等等可以实现对齐样本的相对接近,而无需任何标注或监督。

8、通过考虑以下详细描述和附图,本公开内容的其它方面或变型及其他优点将变得显而易见。

本文档来自技高网...

【技术保护点】

1.一种用于实体对齐的计算机实现方法,包括:

2.根据权利要求1所述的计算机实现方法,其中,所述相对相似度度量排除对齐的实体或正样本对。

3.根据权利要求1所述的计算机实现方法,还包括:

4.根据权利要求3所述的计算机实现方法,其中,所述至少一个编码器包括在线编码器和用于对当前批次进行编码的目标编码器,并且其中,所述在线编码器通过反向传播直接更新,而所述目标编码器通过动量更新。

5.根据权利要求1或4中的任何一项所述的计算机实现方法,其中,在所述第一图谱和所述第二图谱之间共享所述至少一个编码器。

6.根据权利要求1所述的计算机实现方法,其特征在于在没有训练标签或监督的情况下,自动地对齐实体。

7.根据权利要求1所述的计算机实现方法,其中,获得所述第一多个初始嵌入和所述第二多个初始嵌入还包括:对相邻实体的信息进行聚合。

8.一种用于具有自然语言的图谱的实体对齐的计算机实现方法,包括:

9.一种用于实体对齐的装置,包括:

10.一种用于实体对齐的计算机程序产品,包括:用于执行根据权利要求1-7之一所述的方法的处理器可执行计算机代码。

11.一种存储有用于实体对齐的计算机代码的计算机可读介质,当所述计算机代码由处理器执行时,使得所述处理器执行根据权利要求1-7之一所述的方法。

...

【技术特征摘要】
【国外来华专利技术】

1.一种用于实体对齐的计算机实现方法,包括:

2.根据权利要求1所述的计算机实现方法,其中,所述相对相似度度量排除对齐的实体或正样本对。

3.根据权利要求1所述的计算机实现方法,还包括:

4.根据权利要求3所述的计算机实现方法,其中,所述至少一个编码器包括在线编码器和用于对当前批次进行编码的目标编码器,并且其中,所述在线编码器通过反向传播直接更新,而所述目标编码器通过动量更新。

5.根据权利要求1或4中的任何一项所述的计算机实现方法,其中,在所述第一图谱和所述第二图谱之间共享所述至少一个编码器。

6.根据权利要求1所述的计算机实现方法,其...

【专利技术属性】
技术研发人员:刘潇唐杰E·哈特拉莫诺夫
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1