一种高可用性集群管理方法及相关设备,其中,高可用性集群包括至少一个主节点、至少一个备节点和集群管理装置,集群管理装置通过心跳链路分别与上述至少一个主节点和上述至少一个备节点进行连接通信,该方法包括:针对上述至少一个主节点中的每一个主节点,集群管理装置检测是否发生目标事件,该目标事件为触发集群管理装置针对该主节点进行切主操作的事件;当集群管理装置检测到发生目标事件时,集群管理装置控制上述至少一个备节点中的一个备节点执行升主操作。实施本发明专利技术实施例可以提高服务的可靠性以及降低脑裂的发生概率。
【技术实现步骤摘要】
本专利技术涉及通信
,尤其涉及一种高可用性集群管理方法及相关设备。
技术介绍
随着通信技术的不断发展,越来越多的业务可以通过网络通信来实现。然而,为了使业务能够顺利进行,并提供高可用性的服务,则需要保证业务的连续性。高可用性集群(High Available,简称HA)是一种保证业务连续性的有效解决方案,目前常见的实现方案一般为:设置两个或两个以上的节点,且将其分为主节点和备节点,其中,主节点用于提供服务以执行业务,备节点作为主节点的一个备份,两者之间通过心跳机制来感知对方的存在。当备节点丢失与主节点的心跳时,则认为主节点已宕机,备节点立即转变为主节点来继续执行业务,从而实现业务的连续性。然而,上述实现方案只适用于双机主备的模式,主备模式为一对一,即一个主节点只对应一个备节点,当心跳链路出现问题时,双方都认为自己是主节点,从而导致双主,使得脑裂的发生概率升高,且严重影响服务的可靠性。
技术实现思路
本专利技术实施例公开了一种高可用性集群管理方法及相关设备,能够提高服务的可靠性以及降低脑裂的发生概率。本专利技术实施例第一方面公开了一种高可用性集群管理方法,所述高可用性集群包括至少一个主节点、至少一个备节点和集群管理装置,所述集群管理装置通过心跳链路分别与所述至少一个主节点和所述至少一个备节点进行连接通信,所述方法包括:针对所述至少一个主节点中的每一个主节点,所述集群管理装置检测是否发生目标事件,所述目标事件为触发所述集群管理装置针对所述主节点进行切主操作的事件;当所述集群管理装置检测到发生所述目标事件时,所述集群管理装置控制所述至少一个备节点中的一个备节点执行升主操作。结合本专利技术实施例第一方面,在本专利技术实施例第一方面的第一种可能的实现方式中,所述针对所述至少一个主节点中的每一个主节点,所述集群管理装置检测是否发生目标事件,包括:针对所述至少一个主节点中的每一个主节点,所述集群管理装置检测是否在预设时间间隔内未接收到所述主节点发送的心跳报文;当所述集群管理装置在所述预设时间间隔内未接收到所述主节点发送的所述心跳报文时,则所述集群管理装置检测出发生目标事件。结合本专利技术实施例第一方面,在本专利技术实施例第一方面的第二种可能的实现方式中,所述针对所述至少一个主节点中的每一个主节点,所述集群管理装置检测是否发生目标事件,包括:针对所述至少一个主节点中的每一个主节点,所述集群管理装置检测是否接收到所述主节点发送的异常服务上报信息;当所述集群管理装置接收到所述主节点发送的所述异常服务上报信息时,则所述集群管理装置检测出发生目标事件。结合本专利技术实施例第一方面或第一方面的第一种至第二种中的任一种可能的实现方式,在本专利技术实施例第一方面的第三种可能的实现方式中,各个主节点上加载有浮动ip、Scs1-3锁以及共享卷,不同主节点对应的浮动ip不同,且不同主节点对应的Scs1-3锁不同,一个主节点通过对应的Scs1-3锁唯一访问与所述Scs1-3锁对应的共享卷。结合本专利技术实施例第一方面的第三种可能的实现方式,在本专利技术实施例第一方面的第四种可能的实现方式中,所述高可用性集群还包括卷管理装置,用于管理各个共享卷,所述集群管理装置控制所述至少一个备节点中的一个备节点执行升主操作,包括:所述集群管理装置通知所述至少一个备节点中的一个备节点加载所述主节点对应的浮动ip,以使得所述备节点对所述主节点对应的浮动ip进行加载,并由所述备节点检测所述浮动ip是否存在冲突;当所述浮动ip不存在冲突时,所述集群管理装置接收所述备节点发送的查询请求,所述查询请求用于查询所述浮动ip对应的共享卷;所述集群管理装置针对所述查询请求向所述备节点发送所述浮动ip对应的共享卷,以使所述备节点向所述卷管理装置查询所述共享卷的挂载信息,以获得第一查询结果,所述挂载信息包括所述共享卷的挂载点;当所述第一查询结果为不存在所述共享卷的挂载点时,由所述备节点加载所述共享卷,以使所述备节点作为所述共享卷的挂载点;由所述备节点向所述卷管理装置查询所述共享卷的加锁信息,以获得第二查询结果,所述加锁信息包括所述共享卷加载的Scs1-3锁;当所述第二查询结果为不存在所述共享卷加载的Scs1-3锁时,由所述备节点为所述共享卷加载所述Scs1-3锁。结合本专利技术实施例第一方面的第四种可能的实现方式,在本专利技术实施例第一方面的第五种可能的实现方式中,所述方法还包括:当所述第一查询结果为存在所述共享卷的挂载点时,由所述备节点每隔第一时间向所述卷管理装置查询所述共享卷的挂载点;当由所述备节点向所述卷管理装置执行第一预设次数查询后获得的查询结果均为存在所述共享卷的挂载点时,所述集群管理装置接收所述备节点发送的反馈信息;所述集群管理装置根据所述反馈信息控制所述至少一个备节点中除所述备节点外的一个备节点执行升主操作。结合本专利技术实施例第一方面的第四种可能的实现方式,在本专利技术实施例第一方面的第六种可能的实现方式中,所述方法还包括:当所述第二查询结果为存在所述共享卷加载的Scs1-3锁时,由所述备节点每隔第二时间向所述卷管理装置查询所述共享卷的加锁信息;当由所述备节点向所述卷管理装置执行第二预设次数查询后获得的查询结果均为存在所述共享卷加载的Scs1-3锁时,由所述备节点抢占所述共享卷加载的Scs1-3锁。结合本专利技术实施例第一方面的第一种可能的实现方式,在本专利技术实施例第一方面的第七种可能的实现方式中,所述方法还包括:当所述集群管理装置检测到在所述预设时间间隔内接收到所述主节点发送的所述心跳报文时,所述集群管理装置针对所述心跳报文向所述主节点发送心跳反馈报文。本专利技术实施例第二方面公开了一种集群管理装置,用于执行高可用性集群管理方法,所述高可用性集群包括至少一个主节点、至少一个备节点和集群管理装置,所述集群管理装置通过心跳链路分别与所述至少一个主节点和所述至少一个备节点进行连接通信,所述集群管理装置包括:检测单元,用于针对所述至少一个主节点中的每一个主节点,检测是否发生目标事件,所述目标事件为触发所述集群管理装置针对所述主节点进行切主操作的事件;控制单元,用于当所述检测单元检测到发生所述目标事件时,控制所述至少一个备节点中的一个备节点执行升主操作。结合本专利技术实施例第二方面,在本专利技术实施例第二方面的第一种可能的实现方式中,所述检测单元针对所述至少一个主节点中的每一个主节点,检测是否发生目标事件的方式具体为:所述检测单元针对所述至少一个主节点中的每一个主节点,检测是否在预设时间间隔内未接收到所述主节点发送的心跳报文,当在所述预设时间间隔内未接收到所述主节点发送的所述心跳报文时,则检测出发生目标事件。结合本专利技术实施例第二方面,在本专利技术实施例第二方面的第二种可能的实现方式中,所述检测单元针对所述至少一个主节点中的每一个主节点,检测是否发生目标事件的方式具体为:所述检测单元针对所述至少一个主节点中的每一个主节点,检测是否接收到所述主节点发送的异常服务上报信息,当接收到所述主节点发送的所述异常服务上报信息时,则检测出发生目标事件。结合本专利技术实施例第二方面或第二方面的第一种至第二种中的任一种可能的实现方式,在本专利技术实施例第二方面的第三种可能的实现方式中,各个主节点上加载有浮动ip、Scs1-3锁以及共享卷,不同主节本文档来自技高网...
【技术保护点】
一种高可用性集群管理方法,其特征在于,所述高可用性集群包括至少一个主节点、至少一个备节点和集群管理装置,所述集群管理装置通过心跳链路分别与所述至少一个主节点和所述至少一个备节点进行连接通信,所述方法包括:针对所述至少一个主节点中的每一个主节点,所述集群管理装置检测是否发生目标事件,所述目标事件为触发所述集群管理装置针对所述主节点进行切主操作的事件;当所述集群管理装置检测到发生所述目标事件时,所述集群管理装置控制所述至少一个备节点中的一个备节点执行升主操作。
【技术特征摘要】
【专利技术属性】
技术研发人员:向付晖,
申请(专利权)人:杭州华为数字技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。