知识图谱检测方法及相关装置、电子设备、存储介质制造方法及图纸

技术编号:30105464 阅读:27 留言:0更新日期:2021-09-18 09:14
本申请公开了一种知识图谱检测方法及相关装置、电子设备、存储介质,其中,知识图谱检测方法包括:获取知识图谱和知识图谱中的目标三元组;其中,知识图谱包括若干节点实体以及连接节点实体的实体关系,目标三元组包括目标头实体、目标尾实体两者以及两者之间的目标关系;基于节点实体的若干参考实体,得到节点实体的实体表示;其中,若干参考实体包括节点实体、节点实体的邻接实体、第一实体和第二实体,且第一实体表示节点实体的实体类别,第二实体表示邻接实体的实体类别;基于目标头实体的实体表示、目标关系的关系表示和目标尾实体的实体表示,得到目标三元组的检测结果。上述方案,能够提高知识图谱检测精度。能够提高知识图谱检测精度。能够提高知识图谱检测精度。

【技术实现步骤摘要】
知识图谱检测方法及相关装置、电子设备、存储介质


[0001]本申请涉及自然语言处理
,特别是涉及一种知识图谱检测方法及相关装置、电子设备、存储介质。

技术介绍

[0002]随着信息技术的发展和大数据时代的到来,工业界和学术界开始关注如何将海量数据组织成方便可用的形式。知识图谱能够通过自动化构建的方式,将无结构或半结构化数据组织成有结构数据,因而受到广泛关注。而随着自然语言处理技术的发展,知识图谱自动化构建和开发得到迅猛发展,诸如DBpedia、Wikidata等大规模的知识图谱都是由自动化构建技术生产的。
[0003]目前,由于自动化提取工具并不完善,随着知识图谱规模的扩大,知识图谱质量的下降是无法避免的,从而导致基于知识图谱的下游应用,如推荐系统、实体链接和问答系统也会受到知识图谱质量的影响。本申请专利技术人研究发现,现有知识图谱检测方式仍然存在检测精度不足的问题,从而难以确保知识图谱质量。有鉴于此,如何提高知识图谱检测精度成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种知识图谱检测方法及相关装置、电子设备、存储介质,能够提高知识图谱检测精度。
[0005]为了解决上述技术问题,本申请第一方面提供了一种知识图谱检测方法,包括:获取知识图谱和知识图谱中的目标三元组;其中,知识图谱包括若干节点实体以及连接节点实体的实体关系,目标三元组包括目标头实体、目标尾实体两者以及两者之间的目标关系;基于节点实体的若干参考实体,得到节点实体的实体表示;其中,若干参考实体包括节点实体、节点实体的邻接实体、第一实体和第二实体,且第一实体表示节点实体的实体类别,第二实体表示邻接实体的实体类别;基于目标头实体的实体表示、目标关系的关系表示和目标尾实体的实体表示,得到目标三元组的检测结果。
[0006]为了解决上述技术问题,本申请第二方面提供了一种知识图谱检测装置,包括:知识获取模块、实体表示模块和结果检测模块,知识获取模块,用于获取知识图谱和知识图谱中的目标三元组;其中,知识图谱包括若干节点实体以及连接节点实体的实体关系,目标三元组包括目标头实体、目标尾实体两者以及两者之间的目标关系;实体表示模块,用于基于节点实体的若干参考实体,得到节点实体的实体表示;其中,若干参考实体包括节点实体、节点实体的邻接实体、第一实体和第二实体,且第一实体表示节点实体的实体类别,第二实体表示邻接实体的实体类别;结果检测模块,用于基于目标头实体的实体表示、目标关系的关系表示和目标尾实体的实体表示,得到目标三元组的检测结果。
[0007]为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方
面中知识图谱检测方法。
[0008]为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的知识图谱检测方法。
[0009]上述方案,获取知识图谱和知识图谱中的目标三元组,且知识图谱包括若干节点实体以及连接节点实体的实体关系,目标三元组包括目标头实体、目标尾实体两者以及两者之间目标关系,并基于节点实体的若干参考实体,得到节点实体的实体表示,且若干参考实体包括节点实体、节点实体的邻接实体、第一实体和第二实体,且第一实体表示节点实体的实体类别,第二实体表示邻接实体的实体类别,在此基础上,再基于目标头实体的实体表示、目标关系的关系表示和目标尾实体的实体表示,得到目标三元组的检测结果,由于在节点实体的知识表示过程中,不仅能够参考节点实体本身及其邻接实体,还能够参考节点实体本身的实体类别及其邻接实体的实体类别,从而能够提升知识表示的精确性,进而在此基础上再进行检测,有利于提升知识图谱检测精度。
附图说明
[0010]图1是本申请知识图谱检测方法一实施例的流程示意图;图2是知识图谱一实施例的示意图;图3是获取实体表示一实施例的过程示意图;图4是训练知识提取模型一实施例的流程示意图;图5是知识图谱检测装置一实施例的框架示意图;图6是本申请电子设备一实施例的框架示意图;图7是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0011]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0012]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0013]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0014]请参阅图1,图1是本申请知识图谱检测方法一实施例的流程示意图。具体而言,可以包括如下步骤:步骤S11:获取知识图谱和知识图谱中的目标三元组。
[0015]本公开实施例中,知识图谱包括若干节点实体以及连接节点实体的实体关系,目标三元组包括目标头实体、目标尾实体两者以及两者之间的目标关系。需要说明的是,知识图谱是一种结构化语义网络,在知识图谱中知识被组织成三元组形式,三元组可以包括头实体、关系和尾实体,为了便于描述,可以将头实体记为h,关系记为r,尾实体记为t,则三元组可以表示为(h,r,t)。例如,非结构化文本“莎士比亚创作罗密欧与朱丽叶”可以形式化为
三元组(莎士比亚,创作,罗密欧与朱丽叶),其他情况可以以此类推,在此不再一一举例。
[0016]具体地,在知识图谱中存在实体关系连接的两个节点实体以及该实体关系可以组成三元组形式。请结合参阅图2,图2是知识图谱一实施例的示意图。需要说明的是,图2仅示例性地表示实际应用过程中一种可能的知识图谱,并不因此而限定知识图谱的实际网络结构。如图2所示,圆形表示节点实体,圆形内文字表示节点实体的具体名称,具体可以包括但不限于:人名、地名、机构名、电影名、书名、国名等,在此不做限定。为了便于描述,此处以“01”、“02”等数字表示节点实体的具体名称。此外,直线箭头表示实体关系,直线箭头所附文字表示实体关系的关系类别,具体可以包括但不限于:从属关系、亲缘关系、包含关系、继承关系等,在此不做限定。为了便于描述,此处以“r1”、“r2”等表示实体关系的关系类别。直线箭头所指方向表示实体关系的关系方向,即在一个三元组中,通常由头实体指向尾实体。例如,以“继承关系”为例,非结构化文本“汉武帝刘彻继承自汉景帝刘启”可以形式化为三元组(汉武帝刘彻,继承自,汉景帝刘启),即头实体为“汉武帝刘彻”,实体关系为“继承自”,“尾实体”为“汉景帝刘启”,故在知识图谱中由节点实体“汉武帝刘彻”指向节点实体“汉景帝刘启”,其关系类别为“继承自”;类似地,非结构化文本“汉景帝刘启继承自汉文帝刘恒”可以形式化为三元组(汉景本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱检测方法,其特征在于,包括:获取知识图谱和所述知识图谱中的目标三元组;其中,所述知识图谱包括若干节点实体以及连接所述节点实体的实体关系,所述目标三元组包括目标头实体、目标尾实体两者以及所述两者之间的目标关系;基于所述节点实体的若干参考实体,得到所述节点实体的实体表示;其中,所述若干参考实体包括所述节点实体、所述节点实体的邻接实体、第一实体和第二实体,且所述第一实体表示所述节点实体的实体类别,所述第二实体表示所述邻接实体的实体类别;基于所述目标头实体的实体表示、所述目标关系的关系表示和所述目标尾实体的实体表示,得到所述目标三元组的检测结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述节点实体的若干参考实体,得到所述节点实体的实体表示,包括:对于每一所述节点实体,利用所述若干参考实体的权重参数对所述若干参考实体的初始表示进行加权融合,得到所述节点实体的实体表示;其中,所述参考实体与所述节点实体之间所述实体关系的关系属性与所述参考实体的权重参数相关。3.根据权利要求2所述的方法,其特征在于,所述第一实体与所述节点实体之间所述实体关系为预设关系;和/或,所述第二实体与所述节点实体之间所述实体关系,以及所述第二实体对应的邻接实体与所述节点实体之间所述实体关系相同,所述第二实体表示所述对应的邻接实体的实体类别。4.根据权利要求2所述的方法,其特征在于,在所述参考实体对应的关系属性相同的情况下,所述参考实体的权重参数相同,在所述参考实体对应的关系属性不同的情况下,所述参考实体的权重参数不同;和/或,所述关系属性包括:关系类别、关系方向中至少一者。5.根据权利要求2所述的方法,其特征在于,所述第二实体的获取步骤包括:基于所述邻接实体对应的关系属性,将所述邻接实体划分至若干实体集合;其中,所述实体集合内所述邻接实体对应的关系属性相同;对于每一所述实体集合,在存在多个所述邻接实体具有相同实体类别的情况下,将所述相同实体类别表示为所述第二实体。6.根据权利要求1所述的方法,其特征在于,所述实体表示是利用知识提取模型提取得到的,所述知识提取模型是利用样本知识图谱训练得到的,且所述样本知识图谱包括若干样本节点实体以及连接所述样本节点实体的样本实体关系。7.根据权利要求6所述的方法,其特征在于,所述知识提取模型的训练步骤包括:利用所述知识提取模型对所述样本知识图谱进行知识提取,得到所述样本节点实体的样本实体表示;对于样本知识图谱中样本三元组,基于所述样本三元组的第一质量分值得到所述样本三元组的第一置信度,并基于所述样本三元组的第一置信度得到所述样本三元组的第一子损失,以及基于所述样本三元组的第二质量分值得到所述样本三元组的第二置...

【专利技术属性】
技术研发人员:李直旭马桂林邓宸博张大雷
申请(专利权)人:科大讯飞苏州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1