【技术实现步骤摘要】
迁移脚本构建方法、装置、计算机设备及可读存储介质
[0001]本专利技术涉及云存储
,尤其涉及一种迁移脚本构建方法、装置、计算机设备及可读存储介质。
技术介绍
[0002]跨集群迁移数据,操作其中涉及到数据迁移,metastore迁移,hive版本升级等问题。目前集群数据迁移主要是对原始数据原封不动地进行迁移,方案大多数采用的是Hive Export等将数据文本导出到指定的HDFS目录,再使用诸如hadoop distcp命令将数据文本传输到新的集群,最后使用Hive Import将数据文本导入到hive表中,修改对应数据库在hdfs上的存储路径。专利技术人意识到,现有技术因需要人工修改存储路径且数据量庞大,将会导致数据迁移效率低下,错误率高的问题发生。
技术实现思路
[0003]本专利技术的目的是提供一种迁移脚本构建方法、装置、计算机设备及可读存储介质,用于解决现有技术存在的因需要人工修改存储路径且数据量庞大,导致数据迁移效率低下,错误率高发生的问题。
[0004]为实现上述目的,本专利技术提供一种迁移脚本构建方法,所述迁移脚本用于将第一集群的数据迁移至第二集群,包括:
[0005]获取所述第一集群中保存集群数据的迁出地址,及获取所述第二集群中用于接收所述集群数据的迁入地址,构建所述迁出地址和所述迁入地址之间的映射关系;
[0006]提取所述第一集群中的管理脚本文件,根据所述映射关系将所述管理脚本文件中的迁出地址修改为迁入地址,并将所述迁出地址作为所述迁入地址的映射标注 ...
【技术保护点】
【技术特征摘要】
1.一种迁移脚本构建方法,所述迁移脚本用于将第一集群的数据迁移至第二集群,其特征在于,包括:获取所述第一集群中保存集群数据的迁出地址,及获取所述第二集群中用于接收所述集群数据的迁入地址,构建所述迁出地址和所述迁入地址之间的映射关系;提取所述第一集群中的管理脚本文件,根据所述映射关系将所述管理脚本文件中的迁出地址修改为迁入地址,并将所述迁出地址作为所述迁入地址的映射标注,使所述管理脚本文件转为迁移脚本文件;将所述迁移脚本文件部署到所述第二集群中,以作为所述第二集群的所述迁移脚本。2.根据权利要求1所述的迁移脚本构建方法,其特征在于,所述获取所述第一集群中保存集群数据的迁出地址,及获取所述第二集群中用于接收所述集群数据的迁入地址,构建所述迁出地址和所述迁入地址之间的映射关系,包括:从所述第一集群中导出所有第一数据库的第一库名,以及所述第一数据库下所有第一数据表的第一表名,根据所述第一库名和所述第一表名构建第一库表信息;从所述第二集群中导出所有第二数据库的第二库名,以及所述第二数据库下所有第二数据表的第二表名,根据所述第二库名和所述第二表名构建第二库表信息;接收控制端发送的迁移信息,所述迁移信息中包括起点位置信息和终点位置信息;识别所述第一库表信息中与所述起点位置信息对应的第一库名及第一表名,并将所述第一库名及第一表名设为迁出地址;识别所述第二库表信息中与所述终点位置信息对应的第二库名及第二表名,并将所述第二库名及第二表名设为所述迁入地址;将所述迁出地址和所述迁入地址录入预置的映射表中,并在所述映射表中将所述迁出地址和所述迁入地址关联,用以构建所述迁出地址和所述迁入地址之间的映射关系。3.根据权利要求1所述的迁移脚本构建方法,其特征在于,所述根据所述映射关系将所述管理脚本文件中的迁出地址修改为迁入地址,并将所述迁出地址作为所述迁入地址的映射标注,使所述管理脚本文件转为迁移脚本文件,包括:提取并复制所述第一集群中的管理脚本文件得到中间脚本文件,识别所述中间脚本文件中的位置字段,并获取与所述位置字段对应的迁出地址;从所述映射关系中获得与所述迁出地址对应的迁入地址;删除所述中间脚本文件中的所述迁出地址,并将所述迁入地址写入所述中间脚本文件中并与所述位置字段对应;将所述迁出地址作为映射标注,写入所述中间脚本文件中并与所述位置字段对应,以作为所述中间脚本执行所述迁入地址所在代码块的触发条件,并使所述中间脚本文件转为迁移脚本文件。4.根据权利要求1所述的迁移脚本构建方法,其特征在于,所述将所述迁移脚本文件部署到所述第二集群中,包括:在所述第二集群中创建脚本文本,将所述迁移脚本文件写入所述脚本文本中;在所述第二集群中构建脚本库,将所述迁移脚本文件载入所述脚本库中,使所述第二集群能够调用通过所述脚本库调用所述迁移脚本文件。5.根据权利要求1所述的迁移脚本构建方法,其特征在于,所述将所述迁移脚本文件部署到所述第二集群中,以作为所述第二集群...
【专利技术属性】
技术研发人员:韩晓翠,
申请(专利权)人:平安养老保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。