基于元学习的知识图谱分类方法及相关设备技术

技术编号：35180070 阅读：25 留言：0更新日期：2022-10-12 17:48

本申请提供一种基于元学习的知识图谱实体分类方法及相关设备。该方法包括：获取开源知识图谱数据集；利用预先构建的图神经网络模型对所述实体和所述类别进行初始化，获得每个所述实体的嵌入表示及每个所述类别的嵌入表示；基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示，采用注意力机制算法得到该类别的融合嵌入表示；将全部所述实体的嵌入表示和全部所述类别的融合嵌入表示输入分类模型中，经由分类模型输出每个所述实体对应的所述类别。本申请提供的方法及相关设备可以在知识图谱标记实体数量稀疏的情况下提高知识图谱实体分类的准确度，解决知识图谱实体分类任务的长尾分布问题。决知识图谱实体分类任务的长尾分布问题。决知识图谱实体分类任务的长尾分布问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于元学习的知识图谱分类方法及相关设备

[0001]本申请涉及人工智能
，尤其涉及一种基于元学习的知识图谱分类方法及相关设备。

技术介绍

[0002]元学习(Meta Learning),含义为学会学习，Meta Learning希望使得模型获取一种“学会学习”的能力，在已有的“知识”基础上快速学习新的任务。
[0003]互联网的繁荣发展催生出了越来越多的大规模知识库，诸如Freebase，Google Knowledge Graph，YAGO等。这些大型的知识库往往都由包含抽象概念的本体视图以及由实体组成的实例视图组成，两个视图中都包含了大量的三元组关系数据，这些数据可以为诸多知识图谱相关的下游任务提供数据支持。在本体视图中，三元组包括头类别，元关系，尾类别，在实例视图中，三元组包括头实体，关系，尾实体。在两个视图之间，还包含了大量的用于指示实体对应类别的跨视图链接。这些跨视图链接可以作为辅助信息实现知识图谱的下游任务，为关系扩展、共指消解、实体链接等任务打下了数据基础。
[0004]但是，与此同时，跨视图链接本身也存在严重的问题。例如，知识库中，跨视图链接数量往往较少，这会影响知识图谱下游任务的表现，在知识图谱实体分类任务面临了巨大的困难，严重阻碍了知识图谱实体分类的准确性。为了解决知识图谱实体分类问题，研究学者试图提出各种方法，如借助外部信息来辅助完成分类任务，再如利用表示学习方法生成每个实体的表示来完成分类任务，但是这些方法均假设每个类别都有充足的标记样本，忽略了知识图谱中实体类别可能出...

【技术保护点】

【技术特征摘要】
1.一种基于元学习的知识图谱实体分类方法，其特征在于，包括：获取开源知识图谱数据集，所述开源知识图谱数据集包括本体视图和实例视图，所述本体视图包括多个类别，所述实例视图包括多个实体；利用预先构建的图神经网络模型对所述实体和所述类别进行初始化，获得每个所述实体的嵌入表示及每个所述类别的嵌入表示；基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示，采用注意力机制算法得到该类别的融合嵌入表示；将全部所述实体的嵌入表示和全部所述类别的融合嵌入表示输入分类模型中，经由分类模型输出每个所述实体对应的所述类别，其中，所述分类模型是采用元学习方法进行预训练的。2.根据权利要求1所述的，其特征在于，所述图神经网络模型包括第一图神经网络模型和第二图神经网络模型，所述利用预先构建的图神经网络模型对所述实体和所述类别进行初始化，获得每个所述实体的嵌入表示及每个所述类别的嵌入表示，包括：将所述实体输入至所述第一图神经网络模型，经由所述第一图神经网络模型输出所述实体的嵌入表示；将所述类别输入至所述第二图神经网络模型，经由所述第二图神经网络模型输出所述类别的嵌入表示，其中，所述第一图神经网络模型和所述第二图神经网络模型的膜层结构不同。3.根据权利要求1所述的方法，其特征在于，所述基于所述类别的嵌入表示及与该类别在所述本体视图中关联的所有子类别的嵌入表示，采用注意力机制算法得到该类别的融合嵌入表示，包括：采用注意力机制算法将与该类别关联的所有子类别的嵌入表示进行融合，得到初始融合嵌入表示；基于所述类别的嵌入表示、所述初始融合嵌入表示和权重系数得到所述融合嵌入表示。4.根据权利要求1所述的方法，其特征在于，所述预训练包括元训练阶段和元测试阶段，所述分类模型是采用元学习方法进行预训练的，包括：获取开源知识图谱数据集中的跨视图链接，所述跨视图链接包括多个实体
‑
类别对；将所述跨视图链接划分为第一类别集合和第二类别集合；通过图卷积神经网络模型分别对所述第一类别集合和所述第二类别集合中的全部实体和全部类别进行嵌入表示，得到每个实体的嵌入表示和每个类别的嵌入表示；在所述元训练阶段，基于经过嵌入表示的所述第一类别集合对所述分类模型进行训练；在所述元测试阶段，基于经过嵌入表示的所述第二类别集合对经过所述元训练阶段的所述分类模型进行训练。5.根据权利要求4所述的方法，其特征在于，所述在所述元训练阶段，基于经过嵌入表示的所述第一类别集合对所述分类模型进行训练，包括：采用非线性激...

【专利技术属性】
技术研发人员：张忠宝，朱国桢，苏森，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人