System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 故障处理方法、装置及设备制造方法及图纸_技高网

故障处理方法、装置及设备制造方法及图纸

技术编号:43571145 阅读:4 留言:0更新日期:2024-12-06 17:40
本申请涉及云计算技术领域,公开了故障处理方法、装置及设备,包括:获取待处理主机对应的调度策略以及所属亲和组,所述待处理主机为设置在故障主机中的虚拟机,故障主机为主机集群中出现故障的物理主机,调度策略为亲和策略或反亲和策略;基于调度策略及所属亲和组从主机集群中选取目标物理主机;将待处理主机迁移至目标物理主机中。由于会根据各虚拟机创建时设置的调度策略以及所属亲和组进行调度,选取合适的物理主机进行疏散迁移,可以保证高优先级的虚拟机尽可能不处于同一物理主机中,保证可在单一物理主机出现故障时,尽可能减少对业务的影响,提高云计算平台的高可用性。

【技术实现步骤摘要】

本申请涉及云计算,尤其涉及故障处理方法、装置及设备


技术介绍

1、云计算平台是将一台或多台硬件设备通过云计算软件组成资源池提供计算、存储和网络资源的平台,而高可用是云计算平台中的重要特性,高可用指的是当云计算平台的主机集群中某物理主机发生故障时不能继续提供服务后,将运行在该物理主机上的虚拟机(也可称为云主机)通过疏散迁移到其他正常的物理主机上,保障虚拟机正常使用,业务不受影响。

2、而相关的高可用技术中,在虚拟机创建时未按照优先级进行调度,可能会将多台高优先级的虚拟机调度到同一台物理主机上,当该物理主机故障时,存在较多的高优先级的核心虚拟机,其故障恢复时间也较长,对业务的影响较大,且在迁移时,仍旧未考虑各虚拟机的优先级调度情况,在迁移时,仍旧可能会将高优先级的核心虚拟机迁移至同一物理主机上,若在迁移后,该物理主机再次故障,会再次对业务造成较大的影响。


技术实现思路

1、本申请的主要目的在于提供一种故障处理方法、装置及设备,旨在解决相关技术在云计算平台中创建以及迁移虚拟机时,未考虑虚拟机的优先级情况,会导致故障发生时,对云计算平台的业务造成较大的影响的技术问题。

2、为实现上述目的,本申请提出一种故障处理方法,所述方法包括:

3、获取待处理主机对应的调度策略以及所属亲和组,所述待处理主机为设置在故障主机中的虚拟机,所述故障主机为主机集群中出现故障的物理主机,所述调度策略为亲和策略或反亲和策略;

4、基于所述调度策略及所述所属亲和组从主机集群中选取目标物理主机;

5、将所述待处理主机迁移至所述目标物理主机中。

6、在本申请一种可能的实现方式中,故障主机中设置有至少一个虚拟机;

7、所述获取待处理主机对应的调度策略以及所属亲和组,包括:

8、获取故障主机中各虚拟机对应的主机优先级,所述主机优先级用于表征各虚拟机的重要程度;

9、基于所述主机优先级对所述故障主机中虚拟机进行排序,生成主机处理序列;

10、从所述主机处理序列中提取待处理主机;

11、获取所述待处理主机对应的调度策略以及所属亲和组。

12、在本申请一种可能的实现方式中,所述获取待处理主机对应的调度策略以及所属亲和组之前,还包括:

13、对主机集群中各物理主机进行性能监测;

14、在检测到所述主机集群中任一物理主机性能异常时,将性能异常的物理主机作为待判断主机;

15、获取待判断主机的历史异常计数;

16、对所述历史异常计数进行更新,获得当前异常计数;

17、若所述当前异常计数大于异常计数阈值,则将所述待判断主机作为故障主机;

18、根据所述故障主机中的虚拟机确定待处理主机。

19、在本申请一种可能的实现方式中,所述获取待处理主机对应的调度策略以及所属亲和组,包括:

20、获取待处理主机对应的主机优先级和/或策略标识,并获取所述待处理主机的主机标识信息;

21、根据所述主机优先级和/或策略标识确定所述待处理主机对应的调度策略,并基于所述主机标识信息查找所述待处理主机对应的所属亲和组。

22、在本申请一种可能的实现方式中,所述基于所述调度策略及所述所属亲和组从主机集群中选取目标物理主机,包括:

23、若所述调度策略为亲和策略,则查找主机集群中设置有属于所述所属亲和组的虚拟机的待选物理主机,从所述待选物理主机中选取目标物理主机;

24、或,

25、若所述调度策略为反亲和策略,则查找所述主机集群中未设置有任一属于所述所属亲和组的虚拟机的待选物理主机,从所述待选物理主机中选取目标物理主机。

26、在本申请一种可能的实现方式中,所述将所述待处理主机迁移至所述目标物理主机中之后,还包括:

27、在迁移失败时,获取主机集群中各正常物理主机中的低优先级主机,所述正常物理主机为主机集群中性能正常的物理主机;

28、根据所述低优先级主机构建主机搁置队列,并将所述低优先级主机进行搁置处理;

29、在处理完毕后,返回所述基于所述调度策略及所述所属亲和组在主机集群中选取目标物理主机的步骤。

30、在本申请一种可能的实现方式中,所述将所述低优先级主机进行搁置处理,包括:

31、将所述低优先级主机占用的设备资源进行释放,并保存所述低优先级主机的主机磁盘数据。

32、在本申请一种可能的实现方式中,所述将所述待处理主机迁移至所述目标物理主机中之后,还包括:

33、从所述主机搁置队列中提取待恢复主机,并获取所述主机集群的集群资源信息;

34、若所述集群资源信息满足所述待恢复主机的恢复资源需求,则对所述待恢复主机进行反搁置处理;

35、在处理完毕时,返回所述从所述主机搁置队列中提取待恢复主机,并获取所述主机集群的集群资源信息的步骤。

36、此外,为实现上述目的,本申请还提出一种故障处理装置,所述装置包括:

37、获取模块,用于获取待处理主机对应的调度策略以及所属亲和组,所述待处理主机为设置在故障主机中的虚拟机,所述故障主机为主机集群中出现故障的物理主机,所述调度策略为亲和策略或反亲和策略;

38、选取模块,用于基于所述调度策略及所述所属亲和组从主机集群中选取目标物理主机;

39、迁移模块,用于将所述待处理主机迁移至所述目标物理主机中。

40、此外,为实现上述目的,本申请还提出一种故障处理设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上所述的故障处理方法的步骤。

41、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述的故障处理方法的步骤。

42、此外,为实现上述目的,本申请还提出一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上所述的故障处理方法的步骤。

43、本申请提出的一个或多个技术方案,至少具有以下技术效果:

44、由于会根据各虚拟机创建时设置的调度策略以及所属亲和组进行调度,选取合适的物理主机进行疏散迁移,可以保证高优先级的虚拟机尽可能不处于同一物理主机中,保证可在单一物理主机出现故障时,尽可能减少对业务的影响,提高云计算平台的高可用性。

本文档来自技高网...

【技术保护点】

1.一种故障处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的故障处理方法,其特征在于,故障主机中设置有至少一个虚拟机;

3.如权利要求1所述的故障处理方法,其特征在于,所述获取待处理主机对应的调度策略以及所属亲和组之前,还包括:

4.如权利要求1所述的故障处理方法,其特征在于,所述获取待处理主机对应的调度策略以及所属亲和组,包括:

5.如权利要求1所述的故障处理方法,其特征在于,所述基于所述调度策略及所述所属亲和组从主机集群中选取目标物理主机,包括:

6.如权利要求1至5任一项所述的故障处理方法,其特征在于,所述将所述待处理主机迁移至所述目标物理主机中之后,还包括:

7.如权利要求6所述的故障处理方法,其特征在于,所述将所述低优先级主机进行搁置处理,包括:

8.如权利要求6所述的故障处理方法,其特征在于,所述将所述待处理主机迁移至所述目标物理主机中之后,还包括:

9.一种故障处理装置,其特征在于,所述装置包括:

10.一种故障处理设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至8中任一项所述的故障处理方法的步骤。

...

【技术特征摘要】

1.一种故障处理方法,其特征在于,所述方法包括:

2.如权利要求1所述的故障处理方法,其特征在于,故障主机中设置有至少一个虚拟机;

3.如权利要求1所述的故障处理方法,其特征在于,所述获取待处理主机对应的调度策略以及所属亲和组之前,还包括:

4.如权利要求1所述的故障处理方法,其特征在于,所述获取待处理主机对应的调度策略以及所属亲和组,包括:

5.如权利要求1所述的故障处理方法,其特征在于,所述基于所述调度策略及所述所属亲和组从主机集群中选取目标物理主机,包括:

6.如权利要求1至5任一项所述的故障处理方...

【专利技术属性】
技术研发人员:丁欢欢汪渭春刘磊邵羽
申请(专利权)人:杭州海康威视系统技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1