一种集群修复方法及装置制造方法及图纸

技术编号:37136281 阅读:8 留言:0更新日期:2023-04-06 21:35
本申请公开了一种集群修复方法及装置;该方法包括:监测集群中各个节点的运行状态;并根据各个节点的运行状态监测集群是否能正常运行;若集群不能正常运行,则从集群中删除故障节点;指定集群中的一个正常节点将集群进行重组;对故障节点进行修复;并指定集群中的一个正常节点将修复后的节点添加到重组后的集群。本申请实施例可以自动地对集群进行修复,最大程度地避免业务受到影响。最大程度地避免业务受到影响。最大程度地避免业务受到影响。

【技术实现步骤摘要】
一种集群修复方法及装置


[0001]本申请实施例涉及集群
,尤其涉及一种集群修复方法及装置。

技术介绍

[0002]在传统的集群模式下,至少需要三台服务器才能正常运行,灵活性和可靠性低。现有技术中,集群在运行中因故障不能正常运行时,尤其是集群中的多个节点出现故障或者断电的情况下,集群会停止工作,这样会对业务运行造成一定影响,因此需要手动修复;另一方面,当因业务需求需要在集群中增加新的节点时,需要先完成新增节点的数据库的全量备份及相关配置,并对与之进行全量备份的节点的数据库进行锁定,这样不但不能自动地将此节点添加到集群,而且还会妨碍现有集群的正常运转。

技术实现思路

[0003]本申请提供一种集群修复方法及装置,可以自动地对集群进行修复,最大程度地避免业务受到影响。
[0004]第一方面,本申请实施例提供了一种集群修复方法,所述方法包括:
[0005]监测集群中各个节点的运行状态;并根据各个节点的运行状态监测所述集群是否能正常运行;
[0006]若所述集群不能正常运行,则从所述集群中删除故障节点;
[0007]指定所述集群中的一个正常节点将所述集群进行重组,并对所述故障节点进行修复;
[0008]指定所述集群中的一个正常节点将修复后的节点添加到重组后的集群。
[0009]第二方面,本申请实施例还提供了一种集群修复装置,所述装置包括:监测模块、删除模块、重组模块和添加模块;其中,
[0010]所述监测模块,用于监测集群中各个节点的运行状态;并根据各个节点的运行状态监测所述集群是否能正常运行;所述集群包括一个或者多个节点;
[0011]所述删除模块,用于若所述集群不能正常运行,则从所述集群中删除故障节点;
[0012]所述重组模块,用于指定所述集群中的一个正常节点将所述集群进行重组,并对所述故障节点进行修复;
[0013]所述添加模块,用于指定所述集群中的一个正常节点将修复后的节点添加到重组后的集群。
[0014]本申请实施例提出了一种集群修复方法及装置,监测集群中各个节点的运行状态;并根据各个节点的运行状态监测集群是否能正常运行;若集群不能正常运行,则从集群中删除故障节点;然后指定集群中的一个正常节点将集群进行重组,并对故障节点进行修复;再指定集群中的一个正常节点将修复后的节点添加到重组后的集群。也就是说,在本申请的技术方案中,可以实时地监测集群中各个节点的运行状态;当集群不能正常运行时,先指定节点完成集群重组保证集群不停止工作,之后分析故障节点,修复后将其添加到重组
后的集群。而在现有技术中,集群在运行中因故障不能正常运行时,尤其是集群中的多个节点出现故障或者断电的情况下,集群会停止工作。因此,和现有技术相比,本申请实施例提出的集群修复方法及装置,可以自动地对集群进行修复,最大程度地避免业务受到影响;并且,本申请实施例的技术方案实现简单方便、便于普及,适用范围更广。
附图说明
[0015]图1为本申请实施例提供的集群修复方法的第一流程示意图;
[0016]图2为本申请实施例提供的集群修复方法的第二流程示意图;
[0017]图3为本申请实施例提供的集群修复方法的第三流程示意图;
[0018]图4为本申请实施例提供的集群系统架构示意图;
[0019]图5为本申请实施例提供的集群修复装置的结构示意图;
[0020]图6为本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0021]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0022]实施例一
[0023]图1为本申请实施例提供的集群修复方法的第一流程示意图,该方法可以由集群修复装置或者电子设备来执行,该装置或者电子设备可以由软件和/或硬件的方式实现,该装置或者电子设备可以集成在任何具有网络通信功能的智能设备中。如图1所示,集群修复方法可以包括以下步骤:
[0024]S101、监测集群中各个节点的运行状态;并根据各个节点的运行状态监测集群是否能正常运行。
[0025]在本步骤中,集群中的各个节点可以监测自身以及集群中其他节点的运行状态;并根据各个节点的运行状态监测集群是否能正常运行。具体地,通过监测功能模块监测集群中各个节点的运行状态;其中,监测功能模块位于集群的各个节点上,用于对该节点及集群内其他节点运行状态的监测、故障分析修复以及数据库的备份。需要说明的是,监测功能模块在实际应用中并不限于以上这些功能,该模块还可以实现集群重组、节点添加等功能。
[0026]S102、若集群不能正常运行,则从集群中删除故障节点。
[0027]在本步骤中,若集群不能正常运行,则从集群中删除故障节点。具体地,每一节点都有一个守护进程,该守护进程可以探测自身所在节点的状态,同时还可以探测集群中其他节点的状态。例如,某一个集群包括:节点A、节点B和节点C;假设当节点C发生故障时,节点A的守护进程和节点B的守护进程分别可以探测出节点C发生故障,此时节点A的守护进程和节点B的守护进行可以将节点C从集群中删除,同行,此时也可利用自定义规则指定其中一个节点完成节点C的删除。
[0028]S103、指定集群中的一个正常节点将集群进行重组,并对故障节点进行修复。
[0029]若集群只有一个正常节点,则通过该节点修改集群的配置,将集群的运行模式先转换为单机模式运行,以避免集群因故障停止运行带来的影响。
[0030]若集群的正常节点大于一个,则集群中的节点可以通过自定义规则指定一个节点作为重组执行节点;然后通过重组执行节点设置集群中的一个节点为主节点,并通过主节点对集群进行重组。具体地,选定的重组执行节点可以触发重组执行节点处的监测功能模块执行集群重组操作,获取当前集群中其他正常节点的信息,通过其他正常节点的信息确定数据库信息最新的节点;将数据库信息最新的节点设置为主节点,通过主节点完成重组集群信息配置及数据同步,具体包括主节点修改集群配置信息以及主节点将本节点数据库信息同步到重组后集群中其他各节点。
[0031]同时,指定的重组执行节点需要完成对故障节点问题的分析及修复,针对故障的不同情况作出处理。
[0032]S104、指定集群中的一个正常节点将修复后的节点添加到重组后的集群。
[0033]在本步骤中,利用指定的集群中的正常节点将修复后的节点添加到重组后的集群。具体地,与S103步骤相同,若集群只有一个正常节点,则可以指定该节点为添加执行节点,将已修复的节点加入集群;若集群的正常节点大于一个,则通过自定义规则指定其中的一个正常节点作为添加执行节点,将已修复的节点加入集群。通常情况下,此步骤中添加执行节点即为S103中确定的重组执行节点。
[0034]添加执行节点将修复后的节点添加到重组本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种集群修复方法,其特征在于,所述方法包括:监测集群中各个节点的运行状态;并根据各个节点的运行状态监测所述集群是否能正常运行;若所述集群不能正常运行,则从所述集群中删除故障节点;指定所述集群中的一个正常节点将所述集群进行重组,并对所述故障节点进行修复;指定所述集群中的一个正常节点将修复后的节点添加到重组后的集群。2.根据权利要求1所述的方法,其特征在于,通过监测功能模块监测所述集群中各个节点的运行状态;其中,所述监测功能模块位于所述集群的各个节点上,用于对该节点及集群内其他节点运行状态的监测、故障分析修复以及数据库的备份。3.根据权利要求1所述的方法,其特征在于,若所述集群只有一个正常节点,则修改所述集群的配置,将所述集群的运行模式转换为单机模式运行。4.根据权利要求1所述的方法,其特征在于,指定所述集群中的一个正常节点将所述集群进行重组,包括:若所述集群的正常节点大于一个,则通过自定义规则指定一个节点作为重组执行节点;通过所述重组执行节点设置所述集群中的一个节点为主节点,并通过所述主节点对所述集群进行重组。5.根据权利要求4所述的方法,其特征在于,通过所述重组执行节点设置所述集群中的一个节点为主节点,并通过所述主节点对所述集群进行重组,包括:触发所述重组执行节点处的监测功能模块执行集群重组操作,获取其他正常节点的信息,通过所述其他正常节点的信息确定数据库信息最新的节点;将所述数据库信息最新的节点设置为所述主节点,通过所述主节点完成重组集群信息配置及数据同步。6.根据权利要求5所述的方法,其特征在于,所述方法还包...

【专利技术属性】
技术研发人员:孟凡辉张基峰
申请(专利权)人:深圳正元星捷信息科技有限公司中科信息安全共性技术国家工程研究中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1