本申请提供一种基于元学习的知识图谱实体分类方法及相关设备。该方法包括:获取开源知识图谱数据集;利用预先构建的图神经网络模型对所述实体和所述类别进行初始化,获得每个所述实体的嵌入表示及每个所述类别的嵌入表示;基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示,采用注意力机制算法得到该类别的融合嵌入表示;将全部所述实体的嵌入表示和全部所述类别的融合嵌入表示输入分类模型中,经由分类模型输出每个所述实体对应的所述类别。本申请提供的方法及相关设备可以在知识图谱标记实体数量稀疏的情况下提高知识图谱实体分类的准确度,解决知识图谱实体分类任务的长尾分布问题。决知识图谱实体分类任务的长尾分布问题。决知识图谱实体分类任务的长尾分布问题。
【技术实现步骤摘要】
基于元学习的知识图谱分类方法及相关设备
[0001]本申请涉及人工智能
,尤其涉及一种基于元学习的知识图谱分类方法及相关设备。
技术介绍
[0002]元学习(Meta Learning),含义为学会学习,Meta Learning希望使得模型获取一种“学会学习”的能力,在已有的“知识”基础上快速学习新的任务。
[0003]互联网的繁荣发展催生出了越来越多的大规模知识库,诸如Freebase,Google Knowledge Graph,YAGO等。这些大型的知识库往往都由包含抽象概念的本体视图以及由实体组成的实例视图组成,两个视图中都包含了大量的三元组关系数据,这些数据可以为诸多知识图谱相关的下游任务提供数据支持。在本体视图中,三元组包括头类别,元关系,尾类别,在实例视图中,三元组包括头实体,关系,尾实体。在两个视图之间,还包含了大量的用于指示实体对应类别的跨视图链接。这些跨视图链接可以作为辅助信息实现知识图谱的下游任务,为关系扩展、共指消解、实体链接等任务打下了数据基础。
[0004]但是,与此同时,跨视图链接本身也存在严重的问题。例如,知识库中,跨视图链接数量往往较少,这会影响知识图谱下游任务的表现,在知识图谱实体分类任务面临了巨大的困难,严重阻碍了知识图谱实体分类的准确性。为了解决知识图谱实体分类问题,研究学者试图提出各种方法,如借助外部信息来辅助完成分类任务,再如利用表示学习方法生成每个实体的表示来完成分类任务,但是这些方法均假设每个类别都有充足的标记样本,忽略了知识图谱中实体类别可能出现的长尾分布问题。
技术实现思路
[0005]有鉴于此,本申请的目的在于提出一种基于元学习的知识图谱分类方法及相关设备。
[0006]基于上述目的,本申请提供了一种基于元学习的知识图谱实体分类方法,包括:
[0007]获取开源知识图谱数据集,所述开源知识图谱数据集包括本体视图,和实例视图,所述本体视图包括多个类别,所述实例视图包括多个实体;
[0008]利用预先构建的图神经网络模型对所述实体和所述类别进行初始化,获得每个所述实体的嵌入表示及每个所述类别的嵌入表示;
[0009]基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示,采用注意力机制算法得到该类别的融合嵌入表示;
[0010]将全部所述实体的嵌入表示和全部所述类别的融合嵌入表示输入分类模型中,经由分类模型输出每个所述实体对应的所述类别,其中,所述分类模型是采用元学习方法进行预训练的。
[0011]基于同一专利技术构思,本公开还提供了一种基于复杂语境的元学习的知识图谱分类装置,包括:
[0012]获取模块,获取开源知识图谱数据集,所述开源知识图谱数据集包括本体视图,和实例视图,所述本体视图包括多个类别,所述实例视图包括多个实体;
[0013]初始化模块,利用预先构建的图神经网络模型对所述实体和所述类别进行初始化,获得每个所述实体的嵌入表示及每个所述类别的嵌入表示;
[0014]类别融合模块,基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示,采用注意力机制算法得到该类别的融合嵌入表示;
[0015]分类模块,将全部所述实体的嵌入表示和全部所述类别的融合嵌入表示输入分类模型中,经由分类模型输出每个所述实体对应的所述类别。
[0016]基于同一专利技术构思,本公开还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上所述的方法。
[0017]基于同一专利技术构思,本公开还提供了一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令用于使计算机执行如上所述的方法。
[0018]从上面所述可以看出,本申请提供的一种基于元学习的知识图谱分类方法及相关设备,能够更加有效地、更根本性地解决知识图谱实体分类的问题,可以在小样本场景下的知识图谱实体分类任务中,将传统的基于表示学习的方法即图神经网络与元学习方法结合。在该方法中,由传统的表示学习方法学习出每个实体及类别的嵌入表示,由元学习方法多次学习更新参数,可以在知识图谱标记实体数量稀疏的情况下提高知识图谱实体分类的准确度,解决知识图谱实体分类任务的长尾分布问题,提高了知识图谱分类模型的泛化能力。
附图说明
[0019]为了更清楚地说明本申请或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1为本申请实施例的知识图谱的结构示意图;
[0021]图2为本申请实施例的基于元学习的知识图谱实体分类方法流程示意图的结构示意图;
[0022]图3为本申请实施例的基于元学习的知识图谱实体分类装置的结构示意图;
[0023]图4为本申请实施例的电子设备的结构示意图。
具体实施方式
[0024]为使本申请的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本申请进一步详细说明。
[0025]需要说明的是,除非另外定义,本申请实施例使用的技术术语或者科学术语应当为本申请所属领域内具有一般技能的人士所理解的通常意义。本申请实施例中使用的“第一”、“第二”以及类似的词语并不表示任何顺序、数量或者重要性,而只是用来区分不同的
组成部分。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
[0026]如
技术介绍
所述,知识库往往都由包含抽象概念的本体视图以及由实体组成的实例视图组成,图1示出了现有知识图谱的结构示意图,图中清晰地表示出知识图谱中本体视图和实例视图的结构,本体视图中,三元组包括头类别,元关系,尾类别,如Singer
‑
is_a
‑
Artist;在实例视图中,三元组包括头实体,关系,尾实体,如Rose
‑
Has_award
‑
Nobel Prize。在两个视图之间,还包含了大量的用于指示实体对应类别的跨视图链接,如David
‑
Person就为一对跨视图链接。
[0027]以下结合附图来详细说明本申请的实施例。
[0028]参考图2,本申请提供了一种基于元学习的知识图谱实体分类方法,包括以下几个步骤:
[0029]步骤S201,获取开源知识图谱数据集,所述开源知识图谱数据集包括本体视图和实例视图,所述本体视图包括多个类别,所述实例视图包括多个实体。
[0030]具体的,下载开源的知识图谱数据集,所本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于元学习的知识图谱实体分类方法,其特征在于,包括:获取开源知识图谱数据集,所述开源知识图谱数据集包括本体视图和实例视图,所述本体视图包括多个类别,所述实例视图包括多个实体;利用预先构建的图神经网络模型对所述实体和所述类别进行初始化,获得每个所述实体的嵌入表示及每个所述类别的嵌入表示;基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示,采用注意力机制算法得到该类别的融合嵌入表示;将全部所述实体的嵌入表示和全部所述类别的融合嵌入表示输入分类模型中,经由分类模型输出每个所述实体对应的所述类别,其中,所述分类模型是采用元学习方法进行预训练的。2.根据权利要求1所述的,其特征在于,所述图神经网络模型包括第一图神经网络模型和第二图神经网络模型,所述利用预先构建的图神经网络模型对所述实体和所述类别进行初始化,获得每个所述实体的嵌入表示及每个所述类别的嵌入表示,包括:将所述实体输入至所述第一图神经网络模型,经由所述第一图神经网络模型输出所述实体的嵌入表示;将所述类别输入至所述第二图神经网络模型,经由所述第二图神经网络模型输出所述类别的嵌入表示,其中,所述第一图神经网络模型和所述第二图神经网络模型的膜层结构不同。3.根据权利要求1所述的方法,其特征在于,所述基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示,采用注意力机制算法得到该类别的融合嵌入表示,包括:采用注意力机制算法将与该类别关联的所有子类别的嵌入表示进行融合,得到初始融合嵌入表示;基于所述类别的嵌入表示、所述初始融合嵌入表示和权重系数得到所述融合嵌入表示。4.根据权利要求1所述的方法,其特征在于,所述预训练包括元训练阶段和元测试阶段,所述分类模型是采用元学习方法进行预训练的,包括:获取开源知识图谱数据集中的跨视图链接,所述跨视图链接包括多个实体
‑
类别对;将所述跨视图链接划分为第一类别集合和第二类别集合;通过图卷积神经网络模型分别对所述第一类别集合和所述第二类别集合中的全部实体和全部类别进行嵌入表示,得到每个实体的嵌入表示和每个类别的嵌入表示;在所述元训练阶段,基于经过嵌入表示的所述第一类别集合对所述分类模型进行训练;在所述元测试阶段,基于经过嵌入表示的所述第二类别集合对经过所述元训练阶段的所述分类模型进行训练。5.根据权利要求4所述的方法,其特征在于,所述在所述元训练阶段,基于经过嵌入表示的所述第一类别集合对所述分类模型进行训练,包括:采用非线性激...
【专利技术属性】
技术研发人员:张忠宝,朱国桢,苏森,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。