本发明专利技术提供了一种民主自治的集群管理方法,包括步骤:步骤1:集群启动;步骤2:集群运行自治;步骤3:集群分裂自治;步骤4:集群融合自治;步骤5:集群动态伸缩自治;步骤6:集群管理员治理。本发明专利技术还提供相应的系统。本发明专利技术实现了集群在任意单节点异常、多节点异常时,都具备持续的对外服务、集群管理服务提供能力,还可在任意状态下对集群内节点实施检修升级工作和追加服务节点,对Master的选择不需要第三方服务,完成民主自治选取产生支持集群的分裂自治,提高了容错性和可管理性,本发明专利技术还支持管理员的最高管理权限,可广泛应用于需弹性伸缩的、持续服务质量要求高、集群内节点数目大的集群系统管理。
【技术实现步骤摘要】
本专利技术涉及一种集群管理方法,具体涉及基于集群子系统间民主自治策略的集群管理系统,以提高集群系统的可用性、可管理性及可扩展性。
技术介绍
随着信息技术的发展,计算机技术的应用已经到达了一种前所未有的广泛程度,系统和应用规模成倍增加。在这种情况下,可提供更高并发量访问、更稳定服务质量的系统集群技术就应运而生,目前的集群技术多以Master-Slave模式为基础,Master-Slave集群管理方法在集群系统中定义一个Mater管理子系统(节点)和若干Slave服务提供子系统(节点),Master节点可提供集群管理服务(部分集群系统也将其设计为可提供业务服务),Slave节点仅能提供业务服务,这种集群模式保证了集群管理的唯一性,同时集群内节点可并行对外提供服务,但这种方案具有以下问题:1、Master节点存在单点故障的风险。由于为了保障集群管理的唯一性,集群系统中仅设计了一个Master(一些改进型Master-Slave集群系统设计了备用Master,但也不能避免Master和备用Master都出现故障的情况),而管理功能只由Master提供,所以当Master故障时,整个集群系统虽能正常对外提供业务服务,当丧失了管理功能,在Master修复前都不可对集群进行管理;2、Master-Slave集群系统缺乏弹性伸缩的灵活性。Master-Slave集群在集群启动时为每个节点定义了角色,Master仅管理预先定义好的Slave节点,当由于访问量激增而需要临时增加节点以加快服务响应时、或访问量激降而需要临时减少节点以节约资源时,Master-Slave集群管理模式都难以实现对临时节点的管理。经对现有技术进行检索,发现如下相关文献。申请号:CN201310058640.3,名称:一种用于分布式服务的集群管理方法和系统。该专利技术公开了一种用于分布式服务的集群管理方法和系统,每个服务器向Zookeeper服务发送注册请求;Zookeeper服务根据注册请求对每个服务器进行注册,并根据先后顺序选定其中的一个服务器作为Master;每个已注册的服务器判断是否被选定为Master,如果是则被选定为Master的服务器作为集群管理者对所有的服务器进行管理,并等待其它没有被选定为Master的服务器来注册,否则没有被选定为Master的服务器向选定为Master的服务器进行注册。集群所有服务器启动后首先通过Zookeeper来选举Master,Worker主动联系Master,从而实现Master对集群中所有服务器的管理。该专利技术设计了一种集群中Master服务器的管理办法,通过向指定的Zookeeper服务发送注册请求、根据注册先后顺序来确定Master服务器。但该专利技术对Master的选择需要第三方服务,不能通过民主自治选取产生,需依赖第三方服务,存在第三方服务出现故障时的单点风险;且该专利技术只能存在一个大集群限制,容错性和可管理性较低。
技术实现思路
针对现有技术中的缺陷,本专利技术主要解决的问题是,在保留现有Master-Slave集群管理唯一性、并发提供服务访问的前提下,同时解决集群管理单点故障风险、加强集群系统的弹性伸缩灵活性,使得集群系统具备更好的可管理性和更高的服务提供质量。根据本专利技术提供的一种民主自治的集群管理方法,包括如下步骤:步骤1:集群启动;步骤2:集群运行自治;步骤3:集群分裂自治;步骤4:集群融合自治;步骤5:集群动态伸缩自治;步骤6:集群管理员治理,其中,集群管理员用户集群管理的最高权限,各节点均提供管理员入口,以执行主席节点检修升级、追加服务节点、调整全局策略参数操作。优选地,所述步骤1包括如下步骤:步骤101:集群初始化启动时,根据系统管理员的指定指令产生主席节点,其中,所述指定指令在确定主席过程中拥有最高权限;步骤102:除主席节点外,其余节点自动将本节点角色Role置为Slave节点;步骤103:主席节点管理集群的全局配置策略,并将全局策略初始化派送给各Slave节点,其中,所述全局策略初始化包括:全局节点数量、集群标识、各节点名称、各节点角色、各节点监听地址、各节点服务地址、健康检查策略、不信任策略、信息同步策略、信息同步时间间隔、信息同步时间、民主选举策略、各节点当前状态、集群伸缩策略。优选地,节点状态包括:启动状态BOOTING:当启动失败时,转入脱离状态;当启动成功时,转入控制状态;脱离状态DISCONN:当收到信息同步指令时,转入控制状态;控制状态CONN:当被认为不健康时,转入脱离状态;当收到隔离指令时,转入隔离状态;当收到待机指令时,转入待机状态;当收到关闭指令时,转入关闭进行状态;关闭进行状态SHUTDOWING:当关闭结束后,转入关闭结束状态;隔离状态ISOLATED:当收到集合指令时,转入控制状态;待机状态IDLE:当收到隔离指令时,转入隔离状态;当收到恢复指令时,转入控制状态;当收到关闭指令时,转入关闭进行状态;未定义状态UNASSIGNED:当收到启动指令时,转入启动状态;当收到信息同步指令时,转入控制状态。优选地,所述步骤2包括如下步骤:步骤201:各节点按照信息同步策略及信息同步时间间隔,将自身状态信息块同步给集群中其他节点,其中,所述信息同步策略包括增量同步和海量同步;步骤202:主席节点将全局信息按照信息同步策略及信息同步时间间隔,将集群全局信息同步给所有Slave节点,信息同步策略包括增量同步和海量同步;步骤203:所有节点接收到其他节点的同步信息后,在BBS中更新相应节点信息存储内存块中;步骤204:Slave节点在接收到主席节点全局同步信息时,更新BBS中主席节点信息存储内存块及全局配置变化的参数,比较其余节点更新时间与全局信息包中子项的时间,将BBS中Slave节点信息内存块的信息更新为最新状态值;步骤205:所有节点按照全局健康检查策略检查各自BBS块中其他节点状态,并维护管理节点状态,其中,健康检查策略由检查周期Th、状态裁定周期n*Th决定;步骤206:主席节点执行步骤205操作,当裁定Slave节点状态为脱离状态DISCONN、或者未定义状态UNASSIGNED时,对Slave执行Boot指令;步骤207:Slave节点执行步骤205,根据不信任策略,当裁定主席节点状态为脱离状态DISCONN时,执行步骤208选举操作;不信任策略为健康检查策略与管理员操作的综本文档来自技高网...
【技术保护点】
一种民主自治的集群管理方法,其特征在于,包括如下步骤:步骤1:集群启动;步骤2:集群运行自治;步骤3:集群分裂自治;步骤4:集群融合自治;步骤5:集群动态伸缩自治;步骤6:集群管理员治理,其中,集群管理员用户集群管理的最高权限,各节点均提供管理员入口,以执行主席节点检修升级、追加服务节点、调整全局策略参数操作。
【技术特征摘要】
1.一种民主自治的集群管理方法,其特征在于,包括如下步骤:
步骤1:集群启动;
步骤2:集群运行自治;
步骤3:集群分裂自治;
步骤4:集群融合自治;
步骤5:集群动态伸缩自治;
步骤6:集群管理员治理,其中,集群管理员用户集群管理的最高权限,各节点均
提供管理员入口,以执行主席节点检修升级、追加服务节点、调整全局策略参数操作。
2.根据权利要求1所述的民主自治的集群管理方法,其特征在于,所述步骤1包
括如下步骤:
步骤101:集群初始化启动时,根据系统管理员的指定指令产生主席节点,其中,
所述指定指令在确定主席过程中拥有最高权限;
步骤102:除主席节点外,其余节点自动将本节点角色Role置为Slave节点;
步骤103:主席节点管理集群的全局配置策略,并将全局策略初始化派送给各Slave
节点,其中,所述全局策略初始化包括:全局节点数量、集群标识、各节点名称、各节
点角色、各节点监听地址、各节点服务地址、健康检查策略、不信任策略、信息同步策
略、信息同步时间间隔、信息同步时间、民主选举策略、各节点当前状态、集群伸缩策
略。
3.根据权利要求1所述的民主自治的集群管理方法,其特征在于,节点状态包括:
启动状态BOOTING:当启动失败时,转入脱离状态;当启动成功时,转入控制状态;
脱离状态DISCONN:当收到信息同步指令时,转入控制状态;
控制状态CONN:当被认为不健康时,转入脱离状态;当收到隔离指令时,转入隔离
状态;当收到待机指令时,转入待机状态;当收到关闭指令时,转入关闭进行状态;
关闭进行状态SHUTDOWING:当关闭结束后,转入关闭结束状态SHUTDOWNED;
隔离状态ISOLATED:当收到集合指令时,转入控制状态;
待机状态IDLE:当收到隔离指令时,转入隔离状态;当收到恢复指令时,转入控制
状态;当收到关闭指令时,转入关闭进行状态;
未定义状态UNASSIGNED:当收到启动指令时,转入启动状态;当收到信息同步指令
\t时,转入控制状态。
4.根据权利要求3所述的民主自治的集群管理方法,其特征在于,所述步骤2包
括如下步骤:
步...
【专利技术属性】
技术研发人员:龚敬群,
申请(专利权)人:上海宝信软件股份有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。