一种知识图谱管理平台的构建方法及系统技术方案

技术编号:37290783 阅读:24 留言:0更新日期:2023-04-21 02:39
本发明专利技术公开一种知识图谱管理平台的构建方法及系统,涉及数据处理技术领域;构建知识图谱管理平台的调用接口,构建知识图谱管理平台的基本框架,所述基本框架包括接口调用框架、数据传输框架、数据挖掘框架、多数据源知识图谱融合框架、审核框架及知识图谱展示框架,本发明专利技术方法便于非结构化的文本数据的管理和使用,提高了文本数据的利用率及转化率。提高了文本数据的利用率及转化率。提高了文本数据的利用率及转化率。

【技术实现步骤摘要】
一种知识图谱管理平台的构建方法及系统


[0001]本专利技术公开一种构建方法及系统,涉及数据处理
,具体地说是一种知识图谱管理平台的构建方法及系统。

技术介绍

[0002]知识图谱(Knowledge Graph)本质上是一种语义网络(semantic network)的知识库,即具有有向图结构的一个知识库。知识图谱是由实体、关系和属性组成的一种数据结构。可以实现依托实体语义关系结构进行网络信息资源的语义搜索。若数据来源及适用对象是网络信息资源,可以依托语义关联来实现实体及属性的可视化,从大量的、不完整的、有噪声的、模糊的和随机的数据中,提取隐含在其中的、事先不知道的、但又是可信的、潜在的和有价值的信息和知识。
[0003]但目前还没有较为完善地知识图谱管理平台,能够针对复杂、机器不能理解的非结构化文本数据进行处理,且提高文本数据的利用率及转化率。

技术实现思路

[0004]本专利技术针对现有技术的问题,提供一种知识图谱管理平台的构建方法及系统,从海量的非结构化文本数据中,基于深度学习技术训练实体关系抽取模型构建平台接口,并构建知识图谱管理平台。
[0005]本专利技术提出的具体方案是:本专利技术提供一种知识图谱管理平台的构建方法,构建知识图谱管理平台的调用接口:利用分布式服务采集文本数据,根据所述文本数据进行语料标注,获得样本数据,基于监督学习,在joint模式下根据样本数据训练GPLinker实体关系抽取模型,将训练好的GPLinker实体关系抽取模型按照规定的输入输出格式发布成接口,供知识图谱管理平台在线调用;构建知识图谱管理平台的基本框架,所述基本框架包括接口调用框架、数据传输框架、数据挖掘框架、多数据源知识图谱融合框架、审核框架及知识图谱展示框架,通过所述接口调用框架定义知识图谱构建的实体及关系,形成模式库,通过模式库为接口注册及接口选择提供依据,将发布的GPLinker实体关系抽取模型接口注册到知识图谱管理平台,通过所述数据传输框架上传待处理的数据,针对数据中结构化数据直接处理成指定的数据格式,针对数据中非结构化文本数据通过所述数据挖掘框架抽取实体及关系,通过多数据源知识图谱融合框架融合多数据源的数据,通过审核框架审核评估融合后的多数据源的数据,通过知识图谱展示框架按照知识图谱关系网展示及分析知识图谱。
[0006]进一步,所述的一种知识图谱管理平台的构建方法中所述构建知识图谱管理平台的调用接口,包括:按照标注格式进行所述文本数据的语料标注,所述标注格式的顺序依次
为左实体、关系及右实体。
[0007]进一步,所述的一种知识图谱管理平台的构建方法中所述构建知识图谱管理平台的调用接口,包括:根据样本数据训练GPLinker抽取模型,将样本数据的数据集分为训练集、验证集、测试集和关系约束集,所述训练集中每条数据在文本中以字典的格式表示,所述字典包括文本信息和三元组信息,所述三元组信息包括主体、主体类型、关系、客体和客体类型,所述关系约束集定义关系以及所述关系对应的主体和客体的类别。
[0008]进一步,所述的一种知识图谱管理平台的构建方法中所述通过多数据源知识图谱融合框架融合多数据源的数据,包括:通过所述多数据源知识图谱融合框架进行多数据源的数据的实体消岐和共指消解,通过实体消歧根据当前的语境,建立实体链接,消除同名实体产生的歧义,通过共指消解合并对应同一实体的不同指称。
[0009]本专利技术还提供一种知识图谱管理平台的构建系统,包括接口构建模块和平台框架构建模块,接口构建模块构建知识图谱管理平台的调用接口:利用分布式服务采集文本数据,根据所述文本数据进行语料标注,获得样本数据,基于监督学习,在joint模式下根据样本数据训练GPLinker实体关系抽取模型,将训练好的GPLinker实体关系抽取模型按照规定的输入输出格式发布成接口,供知识图谱管理平台在线调用;平台框架构建模块构建知识图谱管理平台的基本框架,所述基本框架包括接口调用框架、数据传输框架、数据挖掘框架、多数据源知识图谱融合框架、审核框架及知识图谱展示框架,所述平台框架构建模块通过接口调用框架定义知识图谱构建的实体及关系,形成模式库,通过模式库为接口注册及接口选择提供依据,将发布的GPLinker实体关系抽取模型接口注册到知识图谱管理平台,所述平台框架构建模块通过数据传输框架上传待处理的数据,针对数据中结构化数据直接处理成指定的数据格式,针对数据中非结构化文本数据通过所述数据挖掘框架抽取实体及关系,所述平台框架构建模块通过多数据源知识图谱融合框架融合多数据源的数据,所述平台框架构建模块通过审核框架审核评估融合后的多数据源的数据,所述平台框架构建模块通过知识图谱展示框架按照知识图谱关系网展示及分析知识图谱。
[0010]进一步,所述的一种知识图谱管理平台的构建系统中所述接口构建模块构建知识图谱管理平台的调用接口,包括:按照标注格式进行所述文本数据的语料标注,所述标注格式的顺序依次为左实体、关系及右实体。
[0011]进一步,所述的一种知识图谱管理平台的构建系统中所述接口构建模块构建知识图谱管理平台的调用接口,包括:根据样本数据训练GPLinker抽取模型,将样本数据的数据集分为训练集、验证集、测试集和关系约束集,所述训练集中每条数据在文本中以字典的格式表示,所述字典包括文本信息和三元组信息,所述三元组信息包括主体、主体类型、关系、客体和客体类型,所述关系约束集定义关系以及所述关系对应的主体和客体的类别。
[0012]进一步,所述的一种知识图谱管理平台的构建系统中所述平台框架构建模块通过多数据源知识图谱融合框架融合多数据源的数据,包括:通过所述多数据源知识图谱融合
框架进行多数据源的数据的实体消岐和共指消解,通过实体消歧根据当前的语境,建立实体链接,消除同名实体产生的歧义,通过共指消解合并对应同一实体的不同指称。
[0013]本专利技术的有益之处是:本专利技术提供一种知识图谱管理平台的构建方法,构建知识图谱管理平台,利用知识图谱管理平台能够提取非结构化的海量文本数据,并转换文本数据为实体关系结构,展示其关联的知识图谱,便于非结构化的文本数据的管理和使用,提高了文本数据的利用率及转化率。
附图说明
[0014]图1是本专利技术方法流程示意图。
具体实施方式
[0015]下面结合附图和具体实施例对本专利技术作进一步说明,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0016]本专利技术提供一种知识图谱管理平台的构建方法,构建知识图谱管理平台的调用接口:利用分布式服务采集文本数据,根据所述文本数据进行语料标注,获得样本数据,基于监督学习,在joint模式下根据样本数据训练GPLinker实体关系抽取模型,将训练好的GPLinker实体关系抽取模型按照规定的输入输出格式发布成接口,供知识图谱管理平台在线调用;构建知识图谱管理平台的基本框架,所述基本框架包括接口调用框架、数据传输框架、数据挖掘框架、多数据源知识图谱融合框架、审核框本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种知识图谱管理平台的构建方法,其特征是构建知识图谱管理平台的调用接口:利用分布式服务采集文本数据,根据所述文本数据进行语料标注,获得样本数据,基于监督学习,在joint模式下根据样本数据训练GPLinker实体关系抽取模型,将训练好的GPLinker实体关系抽取模型按照规定的输入输出格式发布成接口,供知识图谱管理平台在线调用;构建知识图谱管理平台的基本框架,所述基本框架包括接口调用框架、数据传输框架、数据挖掘框架、多数据源知识图谱融合框架、审核框架及知识图谱展示框架,通过所述接口调用框架定义知识图谱构建的实体及关系,形成模式库,通过模式库为接口注册及接口选择提供依据,将发布的GPLinker实体关系抽取模型接口注册到知识图谱管理平台,通过所述数据传输框架上传待处理的数据,针对数据中结构化数据直接处理成指定的数据格式,针对数据中非结构化文本数据通过所述数据挖掘框架抽取实体及关系,通过多数据源知识图谱融合框架融合多数据源的数据,通过审核框架审核评估融合后的多数据源的数据,通过知识图谱展示框架按照知识图谱关系网展示及分析知识图谱。2.根据权利要求1所述的一种知识图谱管理平台的构建方法,其特征是所述构建知识图谱管理平台的调用接口,包括:按照标注格式进行所述文本数据的语料标注,所述标注格式的顺序依次为左实体、关系及右实体。3.根据权利要求1所述的一种知识图谱管理平台的构建方法,其特征是所述构建知识图谱管理平台的调用接口,包括:根据样本数据训练GPLinker抽取模型,将样本数据的数据集分为训练集、验证集、测试集和关系约束集,所述训练集中每条数据在文本中以字典的格式表示,所述字典包括文本信息和三元组信息,所述三元组信息包括主体、主体类型、关系、客体和客体类型,所述关系约束集定义关系以及所述关系对应的主体和客体的类别。4.根据权利要求1所述的一种知识图谱管理平台的构建方法,其特征是所述通过多数据源知识图谱融合框架融合多数据源的数据,包括:通过所述多数据源知识图谱融合框架进行多数据源的数据的实体消岐和共指消解,通过实体消歧根据当前的语境,建立实体链接,消除同名实体产生的歧义,通过共指消解合并对应同一实体的不同指称。5.一种知识图谱管理平台的构建系统,其特征是包括接口构建模块和平台框架构建模块,接口构建模块构建知识图谱管理平台...

【专利技术属性】
技术研发人员:朱家兵葛庆环胡静旋任佰军谭祥
申请(专利权)人:浪潮软件科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1