【技术实现步骤摘要】
用于失效备援的方法和设备
本公开的实施例总体上计算机
,并且更具体地,涉及用于失效备援的方法和设备。
技术介绍
随着企业数字数据的剧增,通过升级硬件来提高系统性能和容量的纵向扩展方式受限于硬件更新速度已经无法满足客户日益增长的需求。为此,提出了一种通过增加物理设备或者虚拟设备数目而动态升级系统的横向扩展方式。在此使用的术语“物理设备”是指诸如工作站、刀片机、主机、台式计算机、便携式计算机等等物理实体。术语“虚拟设备”是指通过虚拟技术运行于物理实体之上的诸如虚拟机(VM)等的逻辑设备。与纵向扩展方式相比,横向扩展在实时性方面的优势是很明显的。在横向扩展方式中,例如,可以使用由多个物理设备组成的集群代替单个物理设备来提供服务。继而,可以通过向集群中添加新的物理设备来实现性能和容量等等的进一步提高。然而,这种由物理设备组成的集群系统目前缺少用于集群管理的核心集群基础架构特征,诸如集群成员管理、消息传送、失效备援等等。除了物理设备的横向扩展,还提出了虚拟设备的横向扩展。例如,常用的软件定义数据中心(SDDC)通常部署在一种类型的虚拟机(VM)上。在本公开的上下文中,一种类型的VM是指基于一种虚拟化平台和架构、与一种虚拟机管理程序相关联的VM。相应地,不同类型的VM基于不同的虚拟化平台和架构,与不同的虚拟机管理程序相关联。在需要系统升级时,可以向SDDC添加该种类型的VM,以实现横向扩展。然而,在这种系统中,运行VM的物理设备通常是独立的。数据无法在不同物理设备之间移动,从而无法实现负载均衡。另外,当某个VM发生故障时,只能在某个物理机上重启另一个VM,这会造 ...
【技术保护点】
一种在集群中的第一节点处执行的方法,所述集群包括多个异质节点,所述方法包括:确定所述集群中的第二节点处的应用是否发生故障;以及响应于确定所述应用发生故障,促使与所述应用相关联的数据和服务从所述第二节点向所述集群中的第三节点的迁移,所述迁移涉及所述集群中与所述第二节点异质的至少一个节点。
【技术特征摘要】
1.一种在集群中的第一节点处执行的方法,所述集群包括多个异质节点,所述方法包括:确定所述集群中的第二节点处的应用是否发生故障;以及响应于确定所述应用发生故障,促使与所述应用相关联的数据和服务从所述第二节点向所述集群中的第三节点的迁移,所述迁移涉及所述集群中与所述第二节点异质的至少一个节点。2.根据权利要求1所述的方法,其中促使所述迁移包括:促使与所述应用相关联的进程、库和配置信息中的至少一项从所述第二节点向所述第三节点的迁移。3.根据权利要求1所述的方法,其中所述第一节点是所述集群的从节点并且所述第一节点与所述第二节点是同一节点,并且促使所述迁移包括:响应于确定所述应用发生故障,向所述集群的主节点发送用于所述迁移的失效备援请求,所述主节点和所述第三节点中的至少一个与所述第一节点彼此异质;以及响应于从所述第三节点接收到指示发起失效备援过程的消息而发起所述迁移。4.根据权利要求3所述的方法,其中所述发起包括:停止与所述应用相关联的服务失效备援单元,所述服务失效备援单元是封装有所述应用的实例和以下至少一项的容器:与所述应用相关联的进程、库和配置信息。5.根据权利要求4所述的方法,其中所述发起包括:解附与所述应用相关联的存储设备。6.根据权利要求4所述的方法,还包括:将所述服务失效备援单元中的以下至少一项存储在存储设备中:与所述应用相关联的进程、库和配置信息。7.根据权利要求1所述的方法,其中所述第一节点是所述集群的主节点并且所述第一节点与所述第二节点是同一节点,并且促使所述迁移包括:响应于确定所述应用发生故障,在所述集群中广播重选所述集群的新主节点的消息;响应于接收到指示所述集群中的第四节点已经被选为所述新主节点的消息,向所述第四节点发送用于所述迁移的失效备援请求,所述第三节点和所述第四节点中的至少一个与所述第一节点彼此异质;以及响应于从所述第三节点接收到指示发起失效备援过程的消息,发起所述迁移。8.根据权利要求1所述的方法,其中所述第一节点是所述集群的从节点并且所述第一节点和所述第二节点是同一节点,所述方法还包括:响应于以下至少一项而在所述集群中广播将所述第一节点选为所述集群的主节点的第一选举请求:在预定时间段内未接收到来自所述集群的当前主节点的信息,以及从所述当前主节点接收到指示重新选举所述集群的主节点的消息。9.根据权利要求8所述的方法,还包括:从所述集群中的第五节点接收将所述第五节点选作所述主节点的第二选举请求;以及基于以下至少一个比较来确定是选择所述第一节点还是选择所述第五节点作为所述主节点:所述第一节点发送所述第一选举请求的第一时间与所述第五节点发送所述第二选举请求的第二时间的比较,所述第一节点的第一启动时间和所述第五节点的第二启动时间的比较,以及所述第一节点的第一互联网协议(IP)地址和所述第五节点的第二IP地址的比较。10.根据权利要求9所述的方法,还包括:响应于确定选择所述第一节点作为所述主节点,递增与所述第一节点相关联的选举计数;以及响应于所述选举计数超过阈值计数,在所述集群中广播指示所述第一节点已经被选为所述主节点的消息。11.根据权利要求1所述的方法,其中所述第一节点是所述集群的主节点并且所述第二节点是所述集群的从节点,并且所述确定包括:确定是否从所述第二节点接收到用于所述迁移的失效备援请求,所述第一节点和所述第三节点中的至少一个与所述第二节点彼此异质。12.根据权利要求11所述的方法,其中促使所述迁移包括:响应于通过确定从所述第二节点接收到所述失效备援请求而确定所述第二节点处的所述应用发生故障,确定所述第三节点是否可用作所述迁移的目的地节点;以及响应于所述第三节点可用作所...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。