故障处理方法、虚拟架构管理系统和业务管理系统技术方案

技术编号:14755835 阅读:71 留言:0更新日期:2017-03-02 21:14
本发明专利技术提供故障处理方法、虚拟架构管理系统、业务管理系统和虚拟化计算机系统。该故障处理方法包括:虚拟架构管理系统获取故障告警消息,该故障告警消息携带故障设备的标识信息和故障类型;虚拟架构管理系统根据故障告警消息确定第一虚拟机集合,第一虚拟机集合包括受故障设备影响的至少一个第一虚拟机;虚拟架构管理系统向业务管理系统发送状态告警消息,该状态告警消息携带第一虚拟机集合的信息。本发明专利技术的技术方案能够快速地将硬件故障的影响通知给受影响的业务,从而提高业务可靠性。

【技术实现步骤摘要】

本专利技术涉及云计算领域,尤其涉及一种故障处理方法、虚拟架构管理系统、业务管理系统和虚拟化计算机系统。
技术介绍
在云计算领域,各个行业的业务系统正在实施虚拟化或云化部署。目前,业务系统中的业务运行在虚拟机上,虚拟机部署在作为共享资源池的硬件设备上,即业务不再采用传统的专用硬件或物理服务器部署,以实现软件硬件解耦和提高资源利用率。目前,当设备(如物理主机、存储设备等)发生故障后,会把故障设备的故障通过故障告警消息发送给虚拟架构管理系统,虚拟架构管理系统再把故障告警消息发送给业务管理系统,由业务管理系统根据故障告警消息确定受影响的虚拟机和业务应用,并对受影响的业务应用执行故障处理操作。这使得业务管理系统需要感知硬件和硬件故障对应的业务应用,才能对业务应用执行故障处理,这样会使得业务管理系统不能快速地将故障设备通知给故障设备所影响的业务应用,影响业务应用可靠性。
技术实现思路
本专利技术提供一种故障处理方法、虚拟架构管理系统业务管理系统和虚拟化计算机系统,能够快速地将硬件故障对虚拟机的影响通知给受影响的虚拟机所影响的业务,从而提高业务可靠性。第一方面,本专利技术提供了一种故障处理方法。该故障处理方法用于在虚拟化计算机系统中进行故障处理,该虚拟化计算机系统包括:虚拟架构管理系统、业务管理系统以及至少一个虚拟机,至少一个虚拟机运行在至少一台物理设备上,至少一个虚拟机用于执行业务应用,业务管理系统用于管理业务应用,虚拟架构管理系统用于管理至少一个虚拟机和至少一台物理设备。该故障处理方法包括:虚拟架构管理系统获取故障告警消息,故障告警消息携带故障设备的标识信息和故障类型;虚拟架构管理系统根据故障告警消息确定第一虚拟机集合,第一虚拟机集合包括受所述故障设备影响的至少一个第一虚拟机;虚拟架构管理系统向业务管理系统发送状态告警消息,状态告警消息携带第一虚拟机集合的信息。该故障处理方法中,虚拟架构管理系统获取到故障设备上的故障告警消息后,直接对该故障告警消息进行分析处理,获取故障设备影响的一个或多个虚拟机,并向业务管理系统发送这些虚拟机的信息,使得业务管理系统可以直接根据这些虚拟机的信息分析得到受影响的业务应用,进而可以对受影响的业务应用进行处理。与现有技术相比,由虚拟架构管理系统直接根据故障设备的故障告警消息确定受故障设备影响的虚拟机的信息,使得业务管理系统可以直接根据第一虚拟机集合的状态告警消息分析得到受影响的业务应用,而不是根据故障设备的告警消息去分析得到受影响的虚拟机、再分析受影响的业务应用。从而使得业务管理系统不需要直接感知硬件故障,进而可以快速触发业务应用的影响处理,降低业务损失,提高业务应用的可靠性。在一种可能的实现方式中,所述故障处理方法还包括:虚拟架构管理系统根据故障硬件的故障告警消息确定第一虚拟机集合的影响信息,该影响信息用于指示故障设备对第一虚拟机集合中的第一虚拟机产生的影响的类型和/或级别;相应地,状态告警消息还可以携带第一虚拟机集合的影响信息。该故障处理方法中,虚拟架构管理系统根据故障设备的故障告警信息除了可以获取受影响的至少一个虚拟机,还可以获取故障设备发生的故障对这些虚拟机的影响的类型和/或级别,然后在向业务管理系统发送的状态告警消息中还携带用于指示故障设备对第一虚拟机集合中的第一虚拟机产生的影响的类型和/或级别的影响信息,从而使得业务管理系统或业务系统可以更加根据该影响信息对业务应用进行处理,进一步提高业务应用的可靠性。可选地,状态告警信息还可以包括第一虚拟机集合中的第一虚拟机的标识信息、告警标识信息、告警名称信息、告警对象类型信息、告警类型信息、告警产生时间信息、告警部件类型信息、告警部件标识信息和告警部件名称信息。可选地,所述状态告警信息可以包括故障设备的故障类型信息。在一种可能的实现方式中,故障设备对第一虚拟机集合中的第一虚拟机产生的影响的类型包括故障、高风险、中风险、低风险或无影响中的一种或多种类型。可选地,故障设备对第一虚拟机集合中的第一虚拟机产生的影响的级别包括紧急、重要或不重要。在一种可能的实现方式中,该故障处理方法还包括:虚拟架构管理系统接收业务管理系统发送的第一请求消息,第一请求消息用于指示待恢复的虚拟机,该待恢复的虚拟机为第一虚拟机集合中一个子集;虚拟架构管理系统根据第一请求信息优先恢复该待恢复的虚拟机。该故障处理方法中,虚拟架构管理系统可以根据业务管理系统的请求,根据业务管理系统指示的优先级,对受故障设备的故障所影响的第一虚拟机集合中的至少一个虚拟机进行恢复处理。可选地,虚拟架构管理系统对虚拟机进行的恢复处理可以包括:虚拟机热迁移。在一种可能的实现方式中,该故障处理方法还包括:若虚拟架构管理系统在预置时间阈值内未接收到业务管理系统发送的第一请求信息,则按照预置虚拟机恢复策略恢复第一虚拟机集合中的第一虚拟机。该故障处理方法可以保证在业务管理系统没有信息指示虚拟架构管理系统如何恢复第一虚拟机集合中的虚拟机时,虚拟架构管理系统可以主动根据预先配置的恢复策略对第一虚拟机集合中的第一虚拟机进行恢复。在一种可能的实现方式中,该故障处理方法还包括:虚拟架构管理系统向业务管理系统发送状态告警清除消息。该故障处理方法中,虚拟架构管理系统对虚拟机进行恢复处理后,向业务管理系统发送状态告警清除消息,使得业务管理系统可以根据该状态告警清除消息清除之前接收的相关的状态告警消息,从而避免业务管理系统对已经恢复的虚拟机相关的状态告警消息进行分析处理。第二方面,本专利技术提供了一种虚拟架构管理系统,所述虚拟架构管理系统包括用于执行第一方面或第一方面任一种可能实现方式中的故障处理方法的各个模块。本专利技术提供的虚拟架构管理系统,获取到故障设备上的故障告警消息后,直接对该故障告警消息进行分析处理,获取故障设备影响的一个或多个虚拟机,并向业务管理系统发送这些虚拟机的信息,使得业务管理系统可以直接根据这些虚拟机的信息分析得到受影响的业务应用,进而可以受影响的业务应用进行处理。与现有技术相比,由虚拟架构管理系统直接根据故障设备的故障告警消息确定受故障设备影响的虚拟机的信息,使得业务管理系统可以直接根据第一虚拟机集合的状态告警消息分析得到受影响的业务应用,而不是根据故障设备的告警消息去分析得到受影响的虚拟机、再分析受影响的业务应用。从而使得业务管理系统不需要直接感知硬件故障,进而可以快速触发业务应用的影响处理,降低业务损失,提高业务应用的可靠性。第三方面,本专利技术提供一种虚拟架构管理系统,所述虚拟架构管理系统包括处理器、存储器、通信接口和总线。其中,处理器、存储器、通信接口通过总线进行通信,也可以通过无线传输等其他手段实现通信。该存储器用于存储指令,该处理器用于执行该存储器存储的指令。该存储器存储程序代码,且处理器可以调用存储器中存储的程序代码执行第一方面及第一方面任一种可能实现方式中的故障处理方法。第四方面,本专利技术提供了一种计算机可读介质,所述计算机可读介质存储用于虚拟架构管理系统执行的程序代码,所述程序代码包括用于执行第一方面及第一方面任一种可能实现方式中的故障处理方法的指令。第五方面,本专利技术还提供了一种故障处理方法,该故障处理方法用于在虚拟化计算机系统中进行故障处理,虚拟化计算机系统包括:虚拟架构管理系统、业本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/62/201610841392.html" title="故障处理方法、虚拟架构管理系统和业务管理系统原文来自X技术">故障处理方法、虚拟架构管理系统和业务管理系统</a>

【技术保护点】
一种故障处理方法,用于在虚拟化计算机系统中进行故障处理,所述虚拟化计算机系统包括:虚拟架构管理系统、业务管理系统以及至少一个虚拟机,所述至少一个虚拟机运行在至少一台物理设备上,所述至少一个虚拟机用于执行业务应用,所述业务管理系统用于管理所述业务应用,所述虚拟架构管理系统用于管理所述至少一个虚拟机和所述至少一台物理设备,其特征在于,所述故障处理方法包括:所述虚拟架构管理系统获取故障告警消息,所述故障告警消息携带故障设备的标识信息和故障类型;所述虚拟架构管理系统根据所述故障告警消息确定第一虚拟机集合,所述第一虚拟机集合包括受所述故障设备影响的至少一个第一虚拟机;所述虚拟架构管理系统向所述业务管理系统发送状态告警消息,所述状态告警消息携带所述第一虚拟机集合的信息。

【技术特征摘要】
1.一种故障处理方法,用于在虚拟化计算机系统中进行故障处理,所述虚拟化计算机系统包括:虚拟架构管理系统、业务管理系统以及至少一个虚拟机,所述至少一个虚拟机运行在至少一台物理设备上,所述至少一个虚拟机用于执行业务应用,所述业务管理系统用于管理所述业务应用,所述虚拟架构管理系统用于管理所述至少一个虚拟机和所述至少一台物理设备,其特征在于,所述故障处理方法包括:所述虚拟架构管理系统获取故障告警消息,所述故障告警消息携带故障设备的标识信息和故障类型;所述虚拟架构管理系统根据所述故障告警消息确定第一虚拟机集合,所述第一虚拟机集合包括受所述故障设备影响的至少一个第一虚拟机;所述虚拟架构管理系统向所述业务管理系统发送状态告警消息,所述状态告警消息携带所述第一虚拟机集合的信息。2.根据权利要求1所述的故障处理方法,其特征在于,所述故障处理方法还包括:所述虚拟架构管理系统根据所述故障告警消息确定所述第一虚拟机集合的影响信息,所述影响信息用于指示所述故障设备对所述至少一个第一虚拟机产生的影响的类型和/或级别;则所述虚拟架构管理系统向所述业务管理系统发送状态告警消息还携带所述第一虚拟机集合的影响信息。3.根据权利要求2所述的故障处理方法,其特征在于,所述故障设备对所述至少一个第一虚拟机产生的影响的类型包括以下至少一种:故障、高风险、中风险、低风险或无影响。4.根据权利要求1至3中任一所述故障处理方法,其特征在于,所述故障处理方法还包括:所述虚拟架构管理系统接收所述业务管理系统发送的第一请求消息,所述第一请求消息用于指示待恢复的虚拟机,所述待恢复的虚拟机为所述第一虚拟机集合中一个子集;所述虚拟架构管理系统根据所述第一请求信息优先恢复所述待恢复的虚拟机。5.根据权利要求1至3中任一项所述故障处理方法,其特征在于,所述故障处理方法还包括:若所述虚拟架构管理系统在预置时间阈值内未接收到所述业务管理系统发送的所述第一请求信息,则按照预置虚拟机恢复策略恢复所述至少一个第一虚拟机。6.根据权利要求1至5中任一项所述的故障处理方法,其特征在于,所述故障处理方法还包括:所述虚拟架构管理系统向所述业务管理系统发送状态告警清除消息。7.一种虚拟架构管理系统,用于在虚拟化计算机系统中进行故障处理,所述虚拟化计算机系统包括:虚拟架构管理系统、业务管理系统以及至少一个虚拟机,所述至少一个虚拟机运行在至少一台物理设备上,所述至少一个虚拟机用于执行业务应用,所述业务管理系统用于管理所述业务应用,所述虚拟架构管理系统用于管理所述至少一个虚拟机和所述至少一台物理设备,其特征在于,所述虚拟架构管理系统包括:获取模块,用于获取故障告警消息,所述故障告警消息携带故障设备的标识信息和故障类型;确定模块,用于根据所述故障告警消息确定第一虚拟机集合,所述第一虚拟机集合包括受所述故障设备影响的至少一个第一虚拟机;发送模块,用于向所述业务管理系统发送状态告警消息,所述状态告警消息携带所述第一虚拟机集合的信息。8.根据权利要求7所述的虚拟架构管理系统,其特征在于,所述确定模块还用于根据所述故障告警消息确定所述第一虚拟机集合的影响信息,所述影响信息用于指示所述故障设备对所述至少一个第一虚拟机产生的影响的类型和/或级别;则所述发送模块向所述业务管理系统发送的所述状态告警消息还携带所述第一虚拟机集合的影响信息。9.根据权利要求8所述的虚拟架构管理系统,其特征在于,所述故障设备对所述至少一个第一虚拟机产生的影响的类型包括以下至少一种:故障、高风险、中风险、低风险或无影响。10.根据权利要求7至9中任一项所述的虚拟架构管理系统,其特征在于,所述虚拟架构管理系统还包括接收模块和恢复模块;所述接收模块,用于接收所述业务管理系统发送的第一请求消息,所述第一请求消息用于指示待恢复的虚拟机,所述待恢复的虚拟机为所述第一虚拟机集合中一个子集;所述恢复模块,用于根据所述第一请求信息优先恢复所述待恢复的虚拟机。11.根据权利要求7至9中任一项所述的虚拟架构管理系统,其特征在于,所述恢复模块还用于在预置时间阈值内未接收到所述业务管理系统发送的所述第一请求信息时,按照预置虚拟机恢复策略恢复所述至少一个第一虚拟机。12.根据权利要求7至11中任一项所述的虚拟架构管理系统,其特征在于,所述发送模块还用于向所述业务管理系统发送状态告警清除消息。13.一种故障处理方法,用于在虚拟化计算机系统中进行故障处理,所述虚拟化计算机系统包括:虚拟架构管理系统、业务管理系统以及至少一个虚拟机,所述至少一个虚拟机运行在至少一台物理设备上,所述至少一个虚拟机用于执行业务应用,所述业务管理系统用于管理所述业务应用,所述虚拟架构管理系统用于管理所述至少一个虚拟机和所述至少一台物理设备;其特征在于,所述故障处理方法包括:所述业务管理系统接收所述虚拟架构管理系统发送的状态告警消息,所述状态告警消息携带受故障设备影响的第一虚拟机集合的信息,所述第一虚拟机集合中包括至少一个第一虚拟机;所述业务管理系统根据所述状态告警消息确定所述至少一个第一虚拟机关联的业务应用;所述业务管理系统对所述至少一个第一虚拟机关联的业务应用执行处理操作。14.根据权利要求13所述的故障处理方法,其特征在于,所述状态告警消息还携带所述第一虚拟机集合的影响信息,所述影响信息用于指示所述故障设备对所述至少一个第一虚拟机产生的影响的类型和/或级别;则所述业务管理系统对所述至少一个第一虚拟机关联的业务应用执行处理操作,包括:所述业务管理系统根据所述第一虚拟机集合的影响信息对所述至少一个第一虚拟机关联的业务应用执行处理操作。15.根据权利要求14所述的故障处理方法,其特征在于,所述第一虚拟机集合产生的影响的类型包括以下至少一种:故障、高风险、中风险、低风险或无影响。16.根据权利要求13至15中任一所述故障处理方法,其特征在于,所述业务管理系统对所述至少一个第一虚拟机关联的业务应用执行处理操作包括以下方式中的至少一种:所述业务管理系统将所述至少一个第一虚拟机关联的业务...

【专利技术属性】
技术研发人员:李候青
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1