【技术实现步骤摘要】
基于元学习的少样本知识图谱补全方法
本专利技术属于机器学习领域,具体涉及一种基于元学习的少样本知识图谱补全方法。
技术介绍
知识图谱是一种包含多种类型关系和实体的多源数据。知识图谱广泛应用于问答系统、搜索引擎、推荐系统等领域。知识图谱由大量的三元组构成,每个三元组都由头实体,关系和尾实体组成,代表现实世界中的知识。虽然知识图谱中有大量的实体、关系和三元组,但是知识图谱普遍存在不完整的问题,因此需要补全。通过捕捉知识图谱中不同类型的关系和实体之间的联系,并汇聚多源数据中的特征,从而自动补全知识图谱,是知识图谱补全的关键问题。知识图谱嵌入方法被广泛研究,并用于知识图谱补全。这类方法通过将知识图谱中的实体和关系映射到低维向量空间来解决这个问题。但是,这类方法依赖大量的训练三元组,然而知识图谱中很大一部分关系是仅已知少量三元组的长尾关系。因此,嵌入方法对长尾关系的效果不好,从而严重影响了知识图谱补全的效果。
技术实现思路
本专利技术的目的在于提供一种能够根据少量三元组就进行知识图谱补全,而且可靠性高、效果好的基于元学习的少样本知识图谱补全方法。本专利技术提供的这种基于元学习的少样本知识图谱补全方法,包括如下步骤:S1.获取待补全的知识图谱和对应的邻域知识图谱;所述邻域知识图谱包括待补全的知识图谱中所有实体的邻域信息;S2.采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化;S3.将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合 ...
【技术保护点】
1.一种基于元学习的少样本知识图谱补全方法,包括如下步骤:/nS1.获取待补全的知识图谱和对应的邻域知识图谱;所述邻域知识图谱包括待补全的知识图谱中所有实体的邻域信息;/nS2.采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化;/nS3.将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务;/nS4.在若干个批次的元训练任务上训练得到少样本知识图谱补全模型;/nS5.采用训练好的少样本知识图谱补全模型,对元测试任务进行补全。/n
【技术特征摘要】
1.一种基于元学习的少样本知识图谱补全方法,包括如下步骤:
S1.获取待补全的知识图谱和对应的邻域知识图谱;所述邻域知识图谱包括待补全的知识图谱中所有实体的邻域信息;
S2.采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化;
S3.将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务;
S4.在若干个批次的元训练任务上训练得到少样本知识图谱补全模型;
S5.采用训练好的少样本知识图谱补全模型,对元测试任务进行补全。
2.根据权利要求1所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤S2所述的采用步骤S1获取的邻域知识图谱,对待补全的知识图谱中的实体嵌入进行初始化,具体为采用嵌入方法,在步骤S1获取的邻域知识图谱上训练得到待补全的知识图谱的实体的嵌入表示;且若邻域知识图谱不存在,则随机初始化待补全的知识图谱的实体的嵌入表示。
3.根据权利要求2所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤S3所述的将待补全的知识图谱的关系集合分为训练关系集合和测试关系集合,并从训练关系集合或测试关系集合中选取一个关系所对应的三元组构建元训练任务或元测试任务,具体包括如下步骤:
A.将待补全的知识图谱的关系集合R分为训练关系集合Rtrain和测试关系集合Rtest;
B.从训练关系集合Rtrain或测试关系集合Rtest中选取一个关系r所对应的三元组构建元训练任务Ttrain或元测试任务Ttest;所述的元训练任务Ttrain和元测试任务Ttest均包括支持集Sr和查询集Qr;
C.采用如下步骤得到元训练任务Ttrain的支持集Sr:
从元训练任务Ttrain的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集Sr;所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
D.采用如下步骤得到元测试任务Ttest的支持集Sr:
从元测试任务Ttest的任务关系r所对应的三元组中随机选取Ns个有效三元组,然后为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的支持集Sr;所述的尾实体候选项集合Ch,r为已知h和r的尾实体候选集合;h为一个有效三元组的头实体;
E.采用如下步骤得到元训练任务Ttrain的查询集Qr:
从剩余的三元组中,随机选取Nq个有效三元组,并为每个有效三元组(h,r,t)从对应的尾实体候选项集合Ch,r中随机选取一个错误尾实体t',从而构建对应的无效三元组(h,r,t'),最终得到元训练任务Ttrain的查询集Qr;
F.采用如下步骤得到元测试任务Ttest的查询集Qr:
从剩余的三元组中,选取一个有效三元组(h,r,t)作为待补全三元组,并穷举对应的尾实体候选项集合Ch,r中的尾实体,并替换有效三元组(h,r,t)中的尾实体,从而构建|Ch,r|个候选三元组,最终得到元测试任务Ttest的查询集Qr;其中||为集合中的元素个数。
4.根据权利要求3所述的基于元学习的少样本知识图谱补全方法,其特征在于步骤S4所述的在若干个批次的元训练任务上训练得到少样本知识图谱补全模型,具体包括如下步骤:
a.将步骤S3构建的元训练任务分成L批次的元训练阶段;
b.对于第l批次的元训练阶段,采用未训练完成的少样本知识图谱补全模型对批次内的所有元训练任务进行学习,并对模型参数进行优化更新;
c.判断步骤b得到的模型是否收敛:
若模型收敛,则...
【专利技术属性】
技术研发人员:向行,陈毅波,蒋志怡,黄鑫,蒋破荒,田建伟,朱宏宇,祝视,吕欣琪,高建良,
申请(专利权)人:国网湖南省电力有限公司,国网湖南省电力有限公司信息通信分公司,国家电网有限公司,
类型:发明
国别省市:湖南;43
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。