基于hadoop的异地双活容灾方法、装置、设备和可读存储介质制造方法及图纸

技术编号:34273305 阅读:21 留言:0更新日期:2022-07-24 16:33
本申请的实施例提供了基于hadoop的异地双活容灾方法、装置、设备和计算机可读存储介质。所述方法包括基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群;所述主集群和镜像集群分布在不同的机房,并保持心跳;通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件。以此方式,实现了异地双活容灾。双活容灾。双活容灾。

Disaster recovery method, device, device and readable storage medium of remote dual active based on Hadoop

【技术实现步骤摘要】
基于hadoop的异地双活容灾方法、装置、设备和可读存储介质


[0001]本申请的实施例涉及跨集群数据传输领域,尤其涉及基于hadoop的异地双活容灾方法、装置、设备和计算机可读存储介质。

技术介绍

[0002]当前,大多的双活容灾以单集群模式实现,即,利用hadoop的数据导入导出机制实现数据的备份。
[0003]但是,对于跨机房的集群,若其中一个机房出现故障,则另一个机房也会存在单点故障问题。即使进行了数据的备份,也不能快速恢复系统的使用。并且在实际应用中数据也很难进行实时备份,即,数据备份时需要确定目标数据的路径。
[0004]当进行任务计算时,不能充分有效利用集群资源,任务计算需要跨机房进行网络传输数据。

技术实现思路

[0005]根据本申请的实施例,提供了一种基于hadoop的异地双活容灾方案。
[0006]在本申请的第一方面,提供了一种基于hadoop的异地双活容灾方法。该方法包括:
[0007]基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群;所述主集群和镜像集群分布在不同的机房,并保持心跳;
[0008]通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件。
[0009]进一步地,所述通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件包括:
[0010]通过共享日志,进行事务日志的中转。
[0011]进一步地,所述共享日志包括由多个journalNode组成。
[0012]进一步地,所述主集群和镜像集群通过data pipeline方式进行传输。
[0013]进一步地,所述主集群和镜像集群各自的dataNode只向各自的nameNode汇报位置及状态信息。
[0014]进一步地,所述主集群和镜像集群的yarn资源调度相互独立。
[0015]在本申请的第二方面,提供了一种基于hadoop的异地双活容灾装置。该装置包括:
[0016]构建模块,用于基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群;所述主集群和镜像集群分布在不同的机房,并保持心跳;
[0017]同步模块,用于通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件。
[0018]进一步地,所述通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件包括:
[0019]通过共享日志,进行事务日志的中转。
[0020]在本申请的第三方面,提供了一种电子设备。该电子设备包括:存储器和处理器,
所述存储器上存储有计算机程序,所述处理器执行所述程序时实现如以上所述的方法。
[0021]在本申请的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现如根据本申请的第一方面的方法。
[0022]本申请实施例提供的基于hadoop的异地双活容灾方法,通过基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群;所述主集群和镜像集群分布在不同的机房,并保持心跳;通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件,实现了异地双活容灾。
[0023]应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本申请的实施例的关键或重要特征,亦非用于限制本申请的范围。本申请的其它特征将通过以下的描述变得容易理解。
附图说明
[0024]结合附图并参考以下详细说明,本申请各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:
[0025]图1示出了本申请的实施例提供的方法所涉及的系统架构图。
[0026]图2示出了根据本申请的实施例的基于hadoop的异地双活容灾方法的流程图;
[0027]图3示出了根据本申请的实施例的基于hadoop的异地双活容灾装置的方框图;
[0028]图4示出了适于用来实现本申请实施例的终端设备或服务器的结构示意图。
具体实施方式
[0029]为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
[0030]另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
[0031]名词解析:
[0032]双活容灾:即灾备系统中使主生产端数据库和备机端数据库同时在线运行,处于可读可查询的状态的技术。
[0033]Hadoop:由Apache基金会所开发的分布式系统基础架构,是一个能够对大量数据进行分布式处理的软件框架。
[0034]图1示出了能够在其中实现本公开的实施例的示例性运行环境的示意图。在运行环境中包括基于hadoop框架的主集群primary cluster,以及与其对应的基于hadoop框架的镜像集群mirror cluster。
[0035]其中,所述primary cluster和mirror cluster分布在不同的机房,之间保持心跳。
[0036]图2示出了根据本公开实施例的基于hadoop的异地双活容灾方法的流程图。所述方法包括:
[0037]S210,基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群。
[0038]在一些实施例中,基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群,参考图1。
[0039]S220,通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件。
[0040]在一些实施例中,主集群primary cluster和镜像集群mirror cluster通过异步的方式同步日志和数据文件。
[0041]进一步地,通过共享日志sharedJournal进行事务日志editLog的中转;所述editLog包括NN

active读写的操作记录。
[0042]具体地,
[0043]通过active

nameNode将editLog写入sharedJounal;
[0044]primary cluster通过standby

nameNode从共享日志中获取事务日志;
[0045]mirror cluster通过active

nameNode从primary cluster的sharedJournal获取editLog;
[0046]mirror clus本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于hadoop的异地双活容灾方法,其特征在于,包括:基于hadoop框架的主集群,构建与其对应的基于hadoop框架的镜像集群;所述主集群和镜像集群分布在不同的机房,并保持心跳;通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件。2.根据权利要求1所述的方法,其特征在于,所述通过异步的方式,同步所述主集群和镜像集群间的日志和数据文件包括:通过共享日志,进行事务日志的中转。3.根据权利要求2所述的方法,其特征在于,所述共享日志包括由多个journalNode组成。4.根据权利要求3所述的方法,其特征在于,所述主集群和镜像集群通过data pipeline方式进行传输。5.根据权利要求4所述的方法,其特征在于,所述主集群和镜像集群各自的dataNode只向各自的nameNode汇报位置及状态信息。6.根据权利要求5所述的方法,其特征在于,...

【专利技术属性】
技术研发人员:刘拓于洋高经郡
申请(专利权)人:北京科杰科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1