一种虚拟机高可用方法及计算集群技术

技术编号:34496522 阅读:17 留言:0更新日期:2022-08-10 09:16
本发明专利技术公开了一种虚拟机高可用方法及计算集群,属于虚拟机技术领域。虚拟机高可用方法包括计算节点步骤和控制节点步骤;计算节点步骤包括:计算节点判断是否进行宕机检测,若是,则计算节点通过第一预设途径联系控制节点,若无法联系到控制节点,则执行脑裂保护;控制节点步骤包括:控制节点判断是否对计算节点进行宕机检测,若是,则控制节点通过第二预设途径联系计算节点;若无法联系到计算节点,则控制节点将计算节点标记为停止状态,将对应的虚拟机标记为故障中状态;控制节点对故障中状态的虚拟机进行启动操作,并在启动失败的次数大于第一阈值时将虚拟机标记为停止状态。本发明专利技术的方法减少了虚拟机服务停机时间,提升了虚拟机的可用性。拟机的可用性。拟机的可用性。

【技术实现步骤摘要】
一种虚拟机高可用方法及计算集群


[0001]本专利技术属于虚拟机
,特别是涉及一种虚拟机高可用方法及计算集群。

技术介绍

[0002]在云计算中,虚拟机被大量使用以取代物理机作为应用部署的载体,如何提升虚拟机的可靠性、减少虚拟机服务停机时间非常重要。

技术实现思路

[0003]本专利技术的目的在于克服现有技术的一项或多项不足,提供一种虚拟机高可用方法及计算集群。
[0004]本专利技术的目的是通过以下技术方案来实现的:根据本专利技术的第一方面,一种虚拟机高可用方法,应用于计算集群,所述计算集群包括控制节点和计算节点,所述计算节点和控制节点心跳连接,所述虚拟机高可用方法包括计算节点步骤和控制节点步骤中的至少一种;所述计算节点步骤包括:计算节点判断是否进行宕机检测;若计算节点进行宕机检测,则所述计算节点通过第一预设途径联系所述控制节点;若所述计算节点通过第一预设途径无法联系到所述控制节点,则该计算节点执行脑裂保护;所述控制节点步骤包括:控制节点判断是否对计算节点进行宕机检测;若对计算节点进行宕机检测,则控制节点通过第二预设途径联系所述计算节点;若控制节点通过第二预设途径无法联系到所述计算节点,则控制节点将所述计算节点标记为停止状态,并将该计算节点上的虚拟机标记为故障中状态;控制节点对处于故障中状态的虚拟机进行启动操作,若处于故障中状态的虚拟机启动失败的次数大于第一阈值,则将该虚拟机标记为停止状态。
[0005]优选的,计算节点判断是否进行宕机检测,包括:若计算节点心跳曾经发送成功,则判断当前心跳是否发送超时;若当前心跳发送超时,则计算节点判断是否超过预设的故障检测时段;若未超过故障检测时段,则进行宕机检测。
[0006]优选的,所述计算节点通过第一预设途径联系所述控制节点,包括:计算节点检测其所有已配IP的网卡链路是否全部中断;若计算节点所有已配IP的网卡链路全部中断,则计算节点通过第一预设途径无法联系到所述控制节点;若计算节点所有已配IP的网卡链路未全部中断,则计算节点检测预设的第一探测
IP清单中所有IP是否全部超时;若第一探测IP清单中所有IP全部超时,则计算节点通过第一预设途径无法联系到所述控制节点。
[0007]优选的,所述计算节点通过第一预设途径联系所述控制节点,包括:计算节点判断是否已启用光纤心跳块;若已启用光纤心跳块,则计算节点通过光纤心跳块发送心跳信息;若计算节点通过光纤心跳块发送心跳信息失败的次数大于第二阈值,则计算节点通过第一预设途径无法联系到所述控制节点;若未启用光纤心跳块,则计算节点检测其所有已配IP的网卡链路是否全部中断;若计算节点所有已配IP的网卡链路未全部中断,则计算节点检测预设的第二探测IP清单中所有IP是否全部超时;若第二探测IP清单中所有IP全部超时,则计算节点判断存储路径是否存在;若计算节点所有已配IP的网卡链路全部中断,则计算节点判断存储路径是否存在;若存储路径不存在,则计算节点通过第一预设途径无法联系到所述控制节点;若存储路径存在,则计算节点启用光纤心跳块,并通过光纤心跳块发送心跳信息。
[0008]优选的,计算节点执行脑裂保护,包括:计算节点销毁本机上的虚拟机。
[0009]优选的,控制节点判断是否对计算节点进行宕机检测,包括:控制节点遍历所有处于运行中状态、且心跳超时的计算节点;控制节点判断所述计算节点是否过了故障检测时段;若计算节点未过故障检测时段,则控制节点将所述计算节点标记为故障中状态,并对所述计算节点进行宕机检测。
[0010]优选的,控制节点判断是否对计算节点进行宕机检测,包括:控制节点遍历所有处于故障中状态的计算节点;控制节点判断所述计算节点是否过了故障检测时段;若计算节点未过故障检测时段,则控制节点对所述计算节点进行宕机检测。
[0011]优选的,控制节点通过第二预设途径联系所述计算节点,包括控制节点将计算节点的标记为检测中状态;控制节点判断所述计算节点所有已配IP的网卡链路是否全部中断;若所述计算节点所有已配IP的网卡链路全部中断,则检测是否已启用光纤心跳块;若已启用光纤心跳块,则检测光纤心跳块到所述计算节点的心跳是否正常;若光纤心跳块到所述计算节点的心跳不正常,则通过旁路监听的方式监听来自所述计算节点的网络请求;若未启用光纤心跳块,则通过旁路监听的方式监听来自所述计算节点的网络请求;若通过旁路监听的方式未监听到来自所述计算节点的网络请求,则控制节点通过第二预设途径无法联系到所述计算节点。
[0012]优选的,控制节点对处于故障中状态的虚拟机进行启动操作,包括:控制节点遍历所有处于故障中状态的虚拟机;控制节点检测所述处于故障中状态的虚拟机是否被锁定;若所述虚拟机未锁定,则控制节点采用多线程锁定方式对处于故障中状态的虚拟机进行在其它主机上的启动操作,所述其它主机为所述计算集群中该虚拟机原宿主机以外的其他计算节点。
[0013]根据本专利技术的第二方面,一种计算集群,包括控制节点、计算节点、通信网和光纤存储,所述计算节点和控制节点心跳连接;所述控制节点和计算节点与所述通信网连接;所述控制节点和计算节点与所述光纤存储连接;所述计算节点在光纤存储上创建有对应的光纤心跳块;所述控制节点用于执行本专利技术的第一方面中的控制节点步骤;所述计算节点用于执行本专利技术的第一方面中的计算节点步骤。
[0014]本专利技术的有益效果是:本专利技术提出的虚拟机高可用方法能够在尽可能短的时间内将服务中断的虚拟机恢复运行,减少了虚拟机服务停机时间,提升了虚拟机的可用性。
附图说明
[0015]图1为本专利技术中计算节点步骤的一个实施例的流程图;图2为计算节点通过第一预设途径联系所述控制节点的一个实施例的流程图;图3为计算节点通过第一预设途径联系所述控制节点的又一个实施例的流程图;图4为本专利技术中控制节点步骤的一个实施例的流程图;图5为控制节点判断是否对计算节点进行宕机检测的一个实施例的流程图;图6为控制节点判断是否对计算节点进行宕机检测的又一个实施例的流程图;图7为控制节点通过第二预设途径联系所述计算节点的一个实施例的流程图。
具体实施方式
[0016]下面将结合实施例,对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域技术人员在没有付出创造性劳动的前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0017]参阅图1

图7,本实施例提供了一种虚拟机高可用方法及计算集群:本专利技术提供的一种虚拟机高可用方法的一个实施例包括:一种虚拟机高可用方法,应用于计算集群,所述计算集群包括控制节点和计算节点,所述计算节点和控制节点心跳连接。一般的,所述计算集群中设置有一个管理网,计算节点和控制节点通过管理网实现心跳连接,同时还设置有一个备用的冗余网或者光线存储。
[0018]所述虚拟机高可用方法包括计算节点步骤和控制节点步骤中的至少一种。
[0019]如图1所示,所述计算节点步骤包括:S100.本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种虚拟机高可用方法,应用于计算集群,所述计算集群包括控制节点和计算节点,所述计算节点和控制节点心跳连接,其特征在于,所述虚拟机高可用方法包括计算节点步骤和控制节点步骤中的至少一种;所述计算节点步骤包括:计算节点判断是否进行宕机检测;若计算节点进行宕机检测,则所述计算节点通过第一预设途径联系所述控制节点;若所述计算节点通过第一预设途径无法联系到所述控制节点,则该计算节点执行脑裂保护;所述控制节点步骤包括:控制节点判断是否对计算节点进行宕机检测;若对计算节点进行宕机检测,则控制节点通过第二预设途径联系所述计算节点;若控制节点通过第二预设途径无法联系到所述计算节点,则控制节点将所述计算节点标记为停止状态,并将该计算节点上的虚拟机标记为故障中状态;控制节点对处于故障中状态的虚拟机进行启动操作,若处于故障中状态的虚拟机启动失败的次数大于第一阈值,则将该虚拟机标记为停止状态。2.根据权利要求1所述的一种虚拟机高可用方法,其特征在于,计算节点判断是否进行宕机检测,包括:若计算节点心跳曾经发送成功,则判断当前心跳是否发送超时;若当前心跳发送超时,则计算节点判断是否超过预设的故障检测时段;若未超过故障检测时段,则进行宕机检测。3.根据权利要求1所述的一种虚拟机高可用方法,其特征在于,所述计算节点通过第一预设途径联系所述控制节点,包括:计算节点检测其所有已配IP的网卡链路是否全部中断;若计算节点所有已配IP的网卡链路全部中断,则计算节点通过第一预设途径无法联系到所述控制节点;若计算节点所有已配IP的网卡链路未全部中断,则计算节点检测预设的第一探测IP清单中所有IP是否全部超时;若第一探测IP清单中所有IP全部超时,则计算节点通过第一预设途径无法联系到所述控制节点。4.根据权利要求1所述的一种虚拟机高可用方法,其特征在于,所述计算节点通过第一预设途径联系所述控制节点,包括:计算节点判断是否已启用光纤心跳块;若已启用光纤心跳块,则计算节点通过光纤心跳块发送心跳信息;若计算节点通过光纤心跳块发送心跳信息失败的次数大于第二阈值,则计算节点通过第一预设途径无法联系到所述控制节点;若未启用光纤心跳块,则计算节点检测其所有已配IP的网卡链路是否全部中断;若计算节点所有已配IP的网卡链路未全部中断,则计算节点检测预设的第二探测IP清单中所有IP是否全部超时;若第二探测IP清单中所有IP全部超时,则计算节点判断存储路径是否存在;
若计算节点所有已配IP的网卡链路全部中断,则计算节点判断存储路径是否存在;若存储路径不存在,则计算节点通过第一预设途径无法联系到所述...

【专利技术属性】
技术研发人员:董世丹傑郝建红龚刚军姜燕杨超邹保平吴晓波
申请(专利权)人:国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1