一种图数据库的数据导入方法及装置制造方法及图纸

技术编号:35074642 阅读:19 留言:0更新日期:2022-09-28 11:39
本申请公开了一种图数据库的数据导入方法及装置,涉及图数据库技术领域,主要目的在于提高图数据库的数据导入的效率和便利性;主要技术方案包括:获取数据导入所需的样本图谱结构,其中,所述样本图谱结构包括多个节点,每一个节点通过至少一个边与周围的至少一个节点关联;确定所述图谱结构中每一个节点和每一个边各自映射的属性项;基于节点映射的属性项从待导入数据中提取每一个节点的属性信息,以及基于边映射的属性项从所述待导入数据中提取每一个边的属性信息;基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,进行数据导入处理。进行数据导入处理。进行数据导入处理。

【技术实现步骤摘要】
一种图数据库的数据导入方法及装置


[0001]本申请涉及图数据库
,特别是涉及一种图数据库的数据导入方法及装置。

技术介绍

[0002]近年来,随着物联网、人工智能等数字化技术的广泛应用,企业数据呈现爆发式增长,数据之间的关联复杂度也随之激增。图数据库由于能够更好的明确和利用数据之间的关系,在复杂问题的处理上有着明显的优势,因此被广泛的应用于数据管理领域。
[0003]数据导入是构建图数据库的重要工作之一。目前,数据导入的常规方法为:首先通过ETL(Extract

Transform

Load,提取

转换

加载)脚本把待入库的数据抽取成单类的节点、关系的CSV(Comma

Separated Values)数据文件。然后通过图数据库自带的批量导入工具将数据灌入图数据库中。上述的常规方法存在如下几点缺陷:一是,通过ETL脚本生成节点、关系对应的CSV文件,由于待入库的数据往往原是散落在多个系统里这时需要做数据的归集和关联,因此需要多个ETL脚本,这些脚本除了做单纯节点和关系的抽取外,还需要做数据的去重、清洗、过滤工作,因此对于脚本的复杂度有一定的增加,同时脚本的可复用性不强,灵活性差,图数据库的图谱结构做了调整,ETL脚本也需要跟着变动,实际生产过程中操作代价比较大。二是,数据导入操作都是后台行为,需要开发人员的大量参与,对于一些分析人员或者图数据库的图谱结构应用的使用人员不友好,他们无法快速构建自己的图谱或者模型,数据导入工作基本依赖开发人员。三是,图数据库的ETL脚本无法复刻,每构建一个新的图数据库,需要重新为其制作对应的ETL脚本。四是,市面上大多数导入工具各自为营,其各自均只能解决特定图数据库的导入问题,通用性不强,因此每构建一个图数据库需要重新选取导入工具。
[0004]专利技术申请内容
[0005]有鉴于此,本申请提出了一种图数据库的数据导入方法及装置,主要目的在于提高图数据库的数据导入的效率和便利性。
[0006]为了达到上述目的,本申请主要提供了如下技术方案:
[0007]第一方面,本申请提供了一种图数据库的数据导入方法,该方法包括:
[0008]获取数据导入所需的样本图谱结构,其中,所述样本图谱结构包括多个节点,每一个节点通过至少一个边与周围的至少一个节点关联;
[0009]确定所述样本图谱结构中每一个节点和每一个边各自映射的属性项;
[0010]基于节点映射的属性项从待导入数据中提取每一个节点的属性信息,以及基于边映射的属性项从所述待导入数据中提取每一个边的属性信息;
[0011]基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,进行数据导入处理。
[0012]在一些实施例中,获取数据导入所需的样本图谱结构,包括:将第一图数据库的图谱结构获取为目标图谱结构,其中,所述第一图数据库为具有成熟图谱结构的图数据库;从
所述目标图谱结构中选取多个目标节点;从所述目标图谱结构中提取所述多个目标节点对应的节点定义信息以及提取所述多个目标节点涉及的边的关系信息,其中,所述节点定义信息用于定义节点,所述关系信息用于描述对应的边的两端连接的节点之间的关系;基于所提取的节点定义信息构建节点以及基于所提取的关系信息构建边,形成所述样本图谱结构。
[0013]在一些实施例中,在形成所述样本图谱结构之后,所述方法还包括:提取所述目标图谱结构中的节点和边已具有的属性项;对所提取的属性项进行去重和合并处理;基于去重和合并处理后得到的属性项,形成属性项集合,其中,所述属性项集合中的每一个属性项在所述样本图谱结构中均有其对应的边和/或节点。
[0014]在一些实施例中,获取数据导入所需的样本图谱结构,包括:通过第一交互界面获取节点定义信息和关系信息,其中,所述第一交互界面用于供用户输入所述节点定义信息和所述关系信息,所述节点定义信息用于定义节点,所述关系信息用于描述对应的边的两端连接的节点之间的关系;基于所获取的节点定义信息构建节点以及基于所述关系信息构建边,形成所述样本图谱结构。
[0015]在一些实施例中,在形成所述样本图谱结构之后,所述方法还包括:基于通过第二交互界面获取的属性项;基于所获取的属性项,形成属性项集合,其中,所述属性项集合中的每一个属性项在所述样本图谱结构中均有其对应的边和/或节点。
[0016]在一些实施例中,确定所述样本图谱结构中每一个节点和每一个边各自映射的属性项,包括:通过第三交互界面展示所述属性项集合;对于任意一个节点或边,若接收到针对其的属性项选取指令,将所述属性项所取指令所涉及的属性项确定为其映射的属性项。
[0017]在一些实施例中,基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,进行数据导入处理,包括:基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,形成三元组结构导入文件;调用目标导入工具将所述三元组结构导入文件导入第二图数据库。
[0018]在一些实施例中,基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,进行数据导入处理,包括:基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,形成三元组;通过第二图数据库的目标接口将所形成的三元组导入所述第二图数据库。
[0019]第二方面,本申请提供了一种图数据库的数据导入装置,该装置包括:
[0020]获取单元,用于获取数据导入所需的样本图谱结构,其中,所述样本图谱结构包括多个节点,每一个节点通过至少一个边与周围的至少一个节点关联;
[0021]确定单元,用于确定所述样本图谱结构中每一个节点和每一个边各自映射的属性项;
[0022]提取单元,用于基于节点映射的属性项从待导入数据中提取每一个节点的属性信息,以及基于边映射的属性项从所述待导入数据中提取每一个边的属性信息;
[0023]导入单元,用于基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,进行数据导入处理。
[0024]第三方面,本申请提供了一种计算机可读存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行第一方面所述的图数据库的
数据导入方法。
[0025]第四方面,本申请提供了一种存储管理设备,所述存储管理设备包括:存储器,用于存储程序;处理器,耦合至所述存储器,用于运行所述程序以执行第一方面所述的图数据库的数据导入方法。
[0026]借由上述技术方案,本申请提供的图数据库的数据导入方法及装置,当存在图数据库的数据导入需求时,首先获取数据导入所需的样本图谱结构。然后确定样本图谱结构中每一个节点和每一个边各自映射的属性项,并基于节点映射的属性项从待导入数据中提取每一个节点的属性信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图数据库的数据导入方法,其特征在于,所述方法包括:获取数据导入所需的样本图谱结构,其中,所述样本图谱结构包括多个节点,每一个节点通过至少一个边与周围的至少一个节点关联;确定所述样本图谱结构中每一个节点和每一个边各自映射的属性项;基于节点映射的属性项从待导入数据中提取每一个节点的属性信息,以及基于边映射的属性项从所述待导入数据中提取每一个边的属性信息;基于每一个节点的属性信息、每一个边的属性信息、所述样本图谱结构中节点与边的关联关系,进行数据导入处理。2.根据权利要求1所述的方法,其特征在于,获取数据导入所需的样本图谱结构,包括:将第一图数据库的图谱结构获取为目标图谱结构,其中,所述第一图数据库为具有成熟图谱结构的图数据库;从所述目标图谱结构中选取多个目标节点;从所述目标图谱结构中提取所述多个目标节点对应的节点定义信息以及提取所述多个目标节点涉及的边的关系信息,其中,所述节点定义信息用于定义节点,所述关系信息用于描述对应的边的两端连接的节点之间的关系;基于所提取的节点定义信息构建节点以及基于所提取的关系信息构建边,形成所述样本图谱结构。3.根据权利要求2所述的方法,其特征在于,在形成所述样本图谱结构之后,所述方法还包括:提取所述目标图谱结构中的节点和边已具有的属性项;对所提取的属性项进行去重和合并处理;基于去重和合并处理后得到的属性项,形成属性项集合,其中,所述属性项集合中的每一个属性项在所述样本图谱结构中均有其对应的边和/或节点。4.根据权利要求1所述的方法,其特征在于,获取数据导入所需的样本图谱结构,包括:通过第一交互界面获取节点定义信息和关系信息,其中,所述第一交互界面用于供用户输入所述节点定义信息和所述关系信息,所述节点定义信息用于定义节点,所述关系信息用于描述对应的边的两端连接的节点之间的关系;基于所获取的节点定义信息构建节点以及基于所述关系信息构建边,形成所述样本图谱结构。5.根据权利要求4所述的方法,其特征在于,在形成所述样本图谱结构之后,所述方法还包括:基于通过第二交互界面获取的属性项;基于所获取的属性项,形成属性项集合,其中...

【专利技术属性】
技术研发人员:王庚午李调全
申请(专利权)人:百融至信北京征信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1