【技术实现步骤摘要】
一种基于大数据量下批量导入数据的方法及装置
本专利技术涉及计算机
,特别涉及一种基于大数据量下批量导入数据的方法及装置。
技术介绍
大数据时代下,随着信息系统的广泛应用,数据量日趋增加,通常需要将大量的数据导入至数据库的目标数据库表中。目前,进行大批量数据导入时,通常需要将待处理数据文件中的大量待处理数据逐一导入目标数据库表中,每将一条待处理数据导入到目标数据库表之后,还需要对导入目标数据库表的该条待处理数据中的各个元数据进行校验,以确定导入到目标数据库表中的各个元数据是否合格,然后对目标数据库表中不合格的元数据进行删除,从而实现将待处理数据文件中的各个待处理数据导入到目标数据库表。上述技术方案中,每一个待处理数据的各个元数据需要逐一导入到目标数据库表,同时,还需要访问导入目标数据库表的每一个元数据以校验每一个元数据是否合格。可见,通过上述技术方案实现将大批量数据导入目标数据库表时,需要频繁访问目标数据库表所对应的数据库,可能影响目标数据库表所对应的数据库的响应速度,进而影响数据导入效率。
技术实现思路
本专利技术实施例提供了一种基于大数据量下批量导入数据的方法及装置,可提要数据导入效率。第一方面,本专利技术提供了一种基于大数据量下批量导入数据的方法,包括:预先设置目标数据库表的至少一个字段主键与至少一个数据节点之间的对应关系;获取待处理数据文件,其中,所述待处理数据文件包括至少两条待处理数据,每一条所述待处理数据包括至少一个元数据,每一条所述待处理数据的每一个所述元数据分别对应有一个参考数据节点;根据每一条所述待处理数据包括的至少一个元数据,以及每一个 ...
【技术保护点】
一种基于大数据量下批量导入数据的方法,其特征在于,包括:预先设置目标数据库表的至少一个字段主键与至少一个数据节点之间的对应关系,还包括:获取待处理数据文件,其中,所述待处理数据文件包括至少两条待处理数据,每一条所述待处理数据包括至少一个元数据,每一条所述待处理数据的每一个所述元数据分别对应有一个参考数据节点;根据每一条所述待处理数据包括的至少一个元数据,以及每一个所述元数据分别对应的参考数据节点,生成临时数据表;校验所述临时数据表中的每一个所述元数据是否合格;当所述临时数据表中存在至少一个目标元数据不合格时,对所述临时数据表中不合格的各个所述目标元数据进行删除处理;根据所述对应关系,将处理后的所述临时数据表中的各个所述元数据批量导入到所述目标数据库表的各个所述字段主键下。
【技术特征摘要】
1.一种基于大数据量下批量导入数据的方法,其特征在于,包括:预先设置目标数据库表的至少一个字段主键与至少一个数据节点之间的对应关系,还包括:获取待处理数据文件,其中,所述待处理数据文件包括至少两条待处理数据,每一条所述待处理数据包括至少一个元数据,每一条所述待处理数据的每一个所述元数据分别对应有一个参考数据节点;根据每一条所述待处理数据包括的至少一个元数据,以及每一个所述元数据分别对应的参考数据节点,生成临时数据表;校验所述临时数据表中的每一个所述元数据是否合格;当所述临时数据表中存在至少一个目标元数据不合格时,对所述临时数据表中不合格的各个所述目标元数据进行删除处理;根据所述对应关系,将处理后的所述临时数据表中的各个所述元数据批量导入到所述目标数据库表的各个所述字段主键下。2.根据权利要求1所述的方法,其特征在于,所述校验所述临时数据表中的每一个所述元数据是否合格,包括:针对于所述临时数据表中的每一个所述元数据,校验所述至少一个数据节点是否包括当前所述元数据所对应的参考数据节点;在所述至少一个数据节点不包括当前所述元数据所对应的参考数据节点时,确定当前所述元数据不合格。3.根据权利要求1所述的方法,其特征在于,在所述校验所述临时数据表中的每一个所述元数据是否合格之前,还包括:确定至少一个所述字段主键所分别对应的至少一个参考元数据;则,所述校验所述临时数据表中的每一个所述元数据是否合格,包括:针对于所述临时数据表中的每一个所述元数据,确定对应当前所述元数据的参考数据节点所对应的目标字段主键;在确定的所述目标字段主键所对应的至少一个参考元数据不包括当前所述元数据时,确定当前所述元数据所属的待处理数据的各个元数据均不合格。4.根据权利要求1所述的方法,其特征在于,在所述校验所述临时数据表中的每一个所述元数据是否合格之前,还包括:确定所述目标数据库表的每一个所述字段主键所分别对应的字符约束条件;则,所述校验所述临时数据表中的每一个所述元数据是否合格,包括:针对于所述临时数据表中的每一个所述元数据,确定对应当前所述元数据的参考数据节点所对应的目标字段主键;校验当前所述元数据是否符合所述目标字段主键所对应的约束条件;在当前所述元数据不符合所述目标字段主键所对应的约束条件时,确定当前所述元数据不合格。5.根据权利要求4所述的方法,其特征在于,所述约束条件包括:数据类型、数据长度及数据阈值中的任意一种或多种。6.一种基于大数据量下批量导入数据的装置,其特征在于,包括:设置模块,用于预先设置目标数据库表的至少一个字段...
【专利技术属性】
技术研发人员:王志刚,左斌,
申请(专利权)人:山东浪潮通软信息科技有限公司,
类型:发明
国别省市:山东,37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。