基于非结构化数据的知识图谱构建方法技术

技术编号:38614735 阅读:10 留言:0更新日期:2023-08-26 23:42
本发明专利技术公开了基于非结构化数据的知识图谱构建方法,涉及知识图谱构建技术领域,解决了不能够方便的将知识数据进行扫描,使在进行传输的过程中较为不便,使在进行使用时效果一般,利用数据导入模块将需要收集的数据方便的进行导入,将数据集中的进行导入,使内部的文本信息能够方便的进行导入,使数据方便的传输,通过知识采集模块,将上传在数据导入模块中的知识数据进行采集,使文件在进行传输的过程中更加安全,通过知识检测模块,将导出的数据文件进行扫描,利用图谱分类模块,将内部的文件能够方便的进行分类,将知识数据能够方便根据分类进行划分,使数据能够方便的进行查询。询。询。

【技术实现步骤摘要】
基于非结构化数据的知识图谱构建方法


[0001]本专利技术涉及知识图谱构建
,具体为基于非结构化数据的知识图谱构建方法。

技术介绍

[0002]知识图谱从图形上描述了现实世界中的概念和实体之间的复杂关系,让互联网通过一种人类更容易接受的认知世界的方式去传达信息,去组织、管理信息,也让人们更好的理解知识,知识图谱设计到很多的技术,其中主要包括知识表示、图谱构建和图谱应用三个方面,知识图谱还可以结合大数据、深度学习等为我国的智能科技的发展做出巨大的贡献;
[0003]专利公开号为CN112347263A的专利技术公开一种知识图谱构建方法。该专利技术提供了一种知识图谱构建方法,包括:对待处理的句子进行分词,得到多个单独词;识别所述多个单独词中的实体,得到两个一组的实体对;对于每个所述实体对,获取所述句子的句向量,所述句向量包括多个所述单独词的词-位置向量;根据所述句向量提取所述句子多个方面的表示特征;根据所述多个方面的表示特征得到一个融合特征;根据所述融合特征预测所述实体对的实体关系;根据所述实体对和对应的实体关系构建知识图谱。本专利技术充分体现了词组与实体对之间的关联性,并从多个方面、多角度地挖掘句子的特征,能够更加全面、准确地进行实体关系预测,进而可以更加完备地构建知识图谱。
[0004]但是在进行使用的过程中还存在下述缺陷:
[0005]1、现有的图谱在进行制作的过程中,不能够方便的将知识数据进行扫描,使在进行传输的过程中较为不便,同时不能够方便的进行区分图谱的树状分支,使在进行使用时效果一般;
[0006]2、不能够方便的将图谱进行检索,使图谱在进行检测的过程中不能够实时的进行检测,同时检索过程中较为麻烦,使在进行查找过程较为麻烦,同时在进行查询时效率降低。

技术实现思路

[0007]本专利技术旨在至少解决现有技术中存在的技术问题之一;为此本专利技术提出了基于非结构化数据的知识图谱构建方法,用于解决不能够方便的将知识数据进行扫描,使在进行传输的过程中较为不便,同时不能够方便的进行区分图谱的树状分支,使在进行使用时效果一般,不能够方便的将图谱进行检索,使图谱在进行检测的过程中不能够实时的进行检测,同时检索过程中较为麻烦,使在进行查找过程较为麻烦,同时在进行查询时效率降低的技术问题。
[0008]为实现上述目的,根据本专利技术的第一方面的实施例提出基于非结构化数据的知识图谱构建方法,包括数据导入模块、处理中心、图谱树状模块与图谱分类模块;
[0009]所述数据导入模块,将需要收集的数据方便的进行导入,将数据集中的进行导入,使内部的文本信息能够方便的进行导入,使数据方便的传输;
[0010]所述处理中心包括知识采集模块、知识检测模块、知识导入模块与数据传输模块;
[0011]所述知识采集模块,用于将上传在数据导入模块中的知识数据进行采集,将内部的数据进行收集和储存,将有用的知识数据进行剥离,将无用的文字进行删除,采集有用的知识数据进行传输;
[0012]所述知识导入模块,用于知识采集模块内部筛分后的数据进行导入和上传,将数据文件能够安全的进行传输,使数据文件方便的进行上传操作,将数据文件方便的进行导入上传至数据传输模块的内部;
[0013]所述数据传输模块,用于数据的传输,将数据文件进行打包和压缩,使文件能够方便的进行传输使知识数据能够方便的传输,将文件方便的进行上传,使文件在进行传输的过程中更加安全;
[0014]所述知识检测模块,将导出的数据文件进行扫描,检测上传的数据是否有重复、破损以及文件不全的情况,将检测有问题的文件数据进行删除,使文件能够防止产生重复,占用较大内存的情况;
[0015]所述图谱分类模块,将内部的文件能够方便的进行分类,将知识数据能够方便根据分类进行划分,使数据能够方便的进行查询;
[0016]所述图谱树状模块,将知识数据进行分类后,根据分类后的数据进行树状摆列,通过图谱实体将知识数据根据需要划分:事件、景物、故事、人文、政治等进行划分,形成知识图谱。
[0017]优选的,所述将数据导入形成知识图谱的步骤为:
[0018]S1、利用数据导入模块将需要收集的数据方便的进行导入,将数据集中的进行导入,使内部的文本信息能够方便的进行导入,使数据方便的传输,通过知识采集模块,将上传在数据导入模块中的知识数据进行采集,将内部的数据进行收集和储存,将有用的知识数据进行剥离,将无用的文字进行删除,采集有用的知识数据进行传输;
[0019]S2、在知识导入模块的作用下,用于知识采集模块内部筛分后的数据进行导入和上传,将数据文件能够安全的进行传输,使数据文件方便的进行上传操作,将数据文件方便的进行导入上传至数据传输模块的内部,利用数据传输模块,将数据文件进行打包和压缩,使文件能够方便的进行传输使知识数据能够方便的传输,将文件方便的进行上传,使文件在进行传输的过程中更加安全;
[0020]S3、通过知识检测模块,将导入后的知识数据进行扫描,检测上传的数据是否有重复、破损以及文件不全的情况,将检测有问题的文件数据进行删除,利用图谱分类模块,将内部的文件能够方便的进行分类,将知识数据能够方便根据分类进行划分,使数据能够方便的进行查询,通过图谱树状模块,将知识数据进行分类后,根据分类后的数据进行树状摆列,通过图谱实体将知识数据根据需要划分:事件、景物、故事、人文、政治等进行划分,形成知识图谱。
[0021]优选的,所述图谱查询模块对图谱实体进行查询的步骤为:
[0022]P1、通过图谱查询模块,将需要检索的文字进行输入,通过图谱查询模块能够方便的进行查询,将输入的关键字的字节进行传输,通过检索字节传输至图谱检索模块;
[0023]P2、通过图谱检索模块,将上传的字节上传至图谱检索模块的内部,通利用图谱检索模块将与图谱实体进行匹配,将图谱实体能够方便的进行检测,通过图谱实体进行分类
后进行搜索;
[0024]P3、将上传的字节与图谱实体下分类后的事件、景物、故事、人文、政治等进行划分后进行匹配,在进行匹配后使数据能够方便的进行查询,使在进行使用的过程中更加方便,在进行使用时操作方便快捷。
[0025]此外,本专利技术还提供一种电子设备,该电子设备包括:
[0026]存储器,用于非暂时性存储计算机可读指令;以及
[0027]处理器,用于运行所述计算机可读指令,
[0028]其中,所述计算机可读指令被所述处理器运行时,执行上述本专利技术的所提供的方法。
[0029]最后,本专利技术还提供一种存储介质,具体的说,非暂时性地存储计算机可读指令,其中,当所述非暂时性计算机可读指令由计算机执行时,执行上述本专利技术的所提供的方法。
[0030]与现有技术相比,本专利技术的有益效果是:利用数据导入模块将需要收集的数据方便的进行导入,将数据集中的进行导入,使内部的文本信息能够方便的进行导入,使数据方便的传输,通过知识采集模块,将上传在数据导入模块中的知识数据进行采集,将内部的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于非结构化数据的知识图谱构建方法,其特征在于:包括数据导入模块、处理中心、图谱树状模块与图谱分类模块;所述数据导入模块,将需要收集的数据方便的进行导入,将数据集中的进行导入,使内部的文本信息能够方便的进行导入,使数据方便的传输;所述处理中心包括知识采集模块、知识检测模块、知识导入模块与数据传输模块;所述知识采集模块,用于将上传在数据导入模块中的知识数据进行采集,将内部的数据进行收集和储存,将有用的知识数据进行剥离,将无用的文字进行删除,采集有用的知识数据进行传输;所述知识导入模块,用于知识采集模块内部筛分后的数据进行导入和上传,将数据文件能够安全的进行传输,使数据文件方便的进行上传操作,将数据文件方便的进行导入上传至数据传输模块的内部;所述数据传输模块,用于数据的传输,将数据文件进行打包和压缩,使文件能够方便的进行传输使知识数据能够方便的传输,将文件方便的进行上传,使文件在进行传输的过程中更加安全;所述知识检测模块,将导出的数据文件进行扫描,检测上传的数据是否有重复、破损以及文件不全的情况,将检测有问题的文件数据进行删除,使文件能够防止产生重复,占用较大内存的情况;所述图谱分类模块,将内部的文件能够方便的进行分类,将知识数据能够方便根据分类进行划分,使数据能够方便的进行查询;所述图谱树状模块,将知识数据进行分类后,根据分类后的数据进行树状摆列,通过图谱实体将知识数据根据需要划分:事件、景物、故事、人文、政治等进行划分,形成知识图谱。2.根据权利要求1所述的基于非结构化数据的知识图谱构建方法,其特征在于,所述将数据导入形成知识图谱的步骤为:S1、利用数据导入模块将需要收集的数据方便的进行导入,将数据集中的进行导入,使内部的文本信息能够方便的进行导入,使数据方便的传输,通过知识采集模块,将上传在数据导入模块中的知识数据进行采集,将内部的数据进行收集和储存,将有用的知识数据进行剥离,将无用的文字进行删除,采集有用的知识数据进行传输;S2、在知识导入模块的作用下,用于知...

【专利技术属性】
技术研发人员:毛正雄钏涛周靖苏文伟何映军梅东晖李成林
申请(专利权)人:云南电网有限责任公司信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1