当前位置: 首页 > 专利查询>伊姆西公司专利>正文

用于失效备援的方法和设备技术

技术编号:16919091 阅读:106 留言:0更新日期:2017-12-31 14:44
本公开的实施例公开了用于失效备援的方法和设备。在一个实施例中,提供一种在包括多个异质节点的集群中的第一节点处执行的方法。该方法包括:确定集群中的第二节点处的应用是否发生故障;以及响应于确定应用发生故障,促使与应用相关联的数据和服务从第二节点向集群中的第三节点的迁移,该迁移涉及集群中与第二节点异质的至少一个节点。还公开了在该集群中的第三节点处执行的方法以及相应的设备和计算机程序产品。

【技术实现步骤摘要】
用于失效备援的方法和设备
本公开的实施例总体上计算机
,并且更具体地,涉及用于失效备援的方法和设备。
技术介绍
随着企业数字数据的剧增,通过升级硬件来提高系统性能和容量的纵向扩展方式受限于硬件更新速度已经无法满足客户日益增长的需求。为此,提出了一种通过增加物理设备或者虚拟设备数目而动态升级系统的横向扩展方式。在此使用的术语“物理设备”是指诸如工作站、刀片机、主机、台式计算机、便携式计算机等等物理实体。术语“虚拟设备”是指通过虚拟技术运行于物理实体之上的诸如虚拟机(VM)等的逻辑设备。与纵向扩展方式相比,横向扩展在实时性方面的优势是很明显的。在横向扩展方式中,例如,可以使用由多个物理设备组成的集群代替单个物理设备来提供服务。继而,可以通过向集群中添加新的物理设备来实现性能和容量等等的进一步提高。然而,这种由物理设备组成的集群系统目前缺少用于集群管理的核心集群基础架构特征,诸如集群成员管理、消息传送、失效备援等等。除了物理设备的横向扩展,还提出了虚拟设备的横向扩展。例如,常用的软件定义数据中心(SDDC)通常部署在一种类型的虚拟机(VM)上。在本公开的上下文中,一种类型的VM是指基于一种虚拟化平台和架构、与一种虚拟机管理程序相关联的VM。相应地,不同类型的VM基于不同的虚拟化平台和架构,与不同的虚拟机管理程序相关联。在需要系统升级时,可以向SDDC添加该种类型的VM,以实现横向扩展。然而,在这种系统中,运行VM的物理设备通常是独立的。数据无法在不同物理设备之间移动,从而无法实现负载均衡。另外,当某个VM发生故障时,只能在某个物理机上重启另一个VM,这会造成较长时间的服务中断。
技术实现思路
总体上,本公开的实施例提出用于失效备援的方法和设备。在第一方面,本公开的实施例提供一种在包括多个异质节点的集群中的第一节点处执行的方法。该方法包括:确定集群中的第二节点处的应用是否发生故障;以及响应于确定应用发生故障,促使与应用相关联的数据和服务从第二节点向集群中的第三节点的迁移,该迁移涉及集群中与第二节点异质的至少一个节点。在此方面,本公开的实施例还提供一种电子设备。该电子设备包括:处理器以及存储有指令的存储器,该指令在被处理器运行时使得电子设备执行根据此方面的方法。在此方面,本公开的实施例还提供一种计算机程序产品,其被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行根据此方面的方法的步骤。在第二方面,本公开的实施例提供一种在包括多个异质节点的集群中的第三节点处执行的方法。该方法包括:确定与集群中的第二节点处的应用相关联的数据和服务是否要迁移到第三节点,该迁移涉及集群中与第二节点异质的至少一个节点;以及响应于确定迁移,获取与应用相关联的数据和服务。在此方面,本公开的实施例还提供一种电子设备。该电子设备包括:处理器以及存储有指令的存储器,该指令在被处理器运行时使得电子设备执行根据此方面的方法。在此方面,本公开的实施例还提供一种计算机程序产品,其被有形地存储在非瞬态计算机可读介质上并且包括机器可执行指令,机器可执行指令在被执行时使机器执行根据此方面的方法的步骤。通过下文描述将会理解,根据本公开的实施例,当集群中的一个节点处的应用发生故障时,可以将与应用相关联的数据和服务从该节点迁移到集群中的另一个节点,该迁移过程涉及异质节点。以此方式,实现了应用的数据和服务在异质节点之间的无缝迁移,显著减少了故障恢复时间和服务中断时间。应当理解,
技术实现思路
部分中所描述的内容并非旨在限定本公开实施例的关键或重要特征,亦非用于限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。附图说明结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标记表示相同或相似的元素,其中:图1示出了本公开的实施例可以实施于其中的示例集群;图2示出了集群中的各个设备之间的通信和处理过程;图3示出了根据本公开的某些实施例的在包括异质节点的集群中的节点处实施的示例方法的流程图;图4示出了根据本公开的某些其他实施例的在包括异质节点的集群中的节点处实施的示例方法的流程图;图5示出了根据本公开的某些实施例的装置的框图;图6示出了根据本公开的某些其他实施例的装置的框图;以及图7示出了一个可以用来实施本公开的实施例的电子设备的示意性框图。在所有附图中,相同或相似参考数字表示相同或相似元素。具体实施例下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。在此使用的术语“包括”、“包含”及类似术语应该被理解为是开放性的术语,即“包括/包含但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在后文描述中给出。如上文所述,纵向扩展方式通过升级硬件来提高系统的容量和性能。例如,物理的专用备份设备(PBBA)系统将包括中央处理单元(CPU)、存储器、非易失性存储器(NVRAM)、磁盘和网络等等的硬件、包括操作系统和专有文件系统等等的软件、以及备份能力和特征等组合在单箱物理设备中。在需要升级时,PBBA系统通常更换最新的硬件,诸如新一代的英特尔芯片、更高密度的磁盘、等等。然而,这种升级方式严重受限于硬件更新速度,无法满足例如由于企业数字数据剧增而导致的客户需求的剧增,而且成本往往很高。另外,采用纵向扩展方式,PBBA系统还存在数据去重成本过高、故障恢复时间过长等等问题。在这种情况下,横向扩展系统日益受到广泛关注。这种系统可以通过动态添加物理或虚拟的个体设备来实现横向扩展。与纵向扩展方式相比,横向扩展在及时性方面的优势是很明显的。如上所述,一种方式是使用由物理设备组成的物理集群代替单箱物理设备来提供服务,继而可以通过向集群中添加新的物理设备来实现系统升级。然而,这种集群系统同样存在故障恢复时间过长的问题。另外,如上所述,这种集群系统目前还缺少能够提供集群管理的核心集群基础架构特征,诸如集群成员管理、消息传送、失效备援等等。另一种横向扩展方式是使用由VM组成虚拟集群来提供服务。例如,越来越多的企业应用和备份数据源在SDDC上运行,而SDDC通常部署同种类型的VM上。在需要系统升级时,可以向SDDC添加该类型的VM。然而,如上所述,在SDDC中,运行VM的物理设备通常在备份方面是独立的,因而在不同物理设备之间无法进行数据移动以实现负载均衡。而且,这些物理设备在去重方面也通常是独立,因而不能提供全局去重特征来实现较佳的去重率。另外,当VM发生故障时,只能在某个物理机上重启另一个VM。通过虚拟机重启来实现故障恢复的时间仍然很长,而且该重启会引起很长时间的服务中断。考虑到物理设备和虚拟机、以及不同类型的虚拟机具有各自的优劣势。例如,与物理设备相比,虚拟机虽然升级成本低,但其性能和容量会受限。另外,某种类型的虚拟机可能需要昂贵的许可费本文档来自技高网
...
用于失效备援的方法和设备

【技术保护点】
一种在集群中的第一节点处执行的方法,所述集群包括多个异质节点,所述方法包括:确定所述集群中的第二节点处的应用是否发生故障;以及响应于确定所述应用发生故障,促使与所述应用相关联的数据和服务从所述第二节点向所述集群中的第三节点的迁移,所述迁移涉及所述集群中与所述第二节点异质的至少一个节点。

【技术特征摘要】
1.一种在集群中的第一节点处执行的方法,所述集群包括多个异质节点,所述方法包括:确定所述集群中的第二节点处的应用是否发生故障;以及响应于确定所述应用发生故障,促使与所述应用相关联的数据和服务从所述第二节点向所述集群中的第三节点的迁移,所述迁移涉及所述集群中与所述第二节点异质的至少一个节点。2.根据权利要求1所述的方法,其中促使所述迁移包括:促使与所述应用相关联的进程、库和配置信息中的至少一项从所述第二节点向所述第三节点的迁移。3.根据权利要求1所述的方法,其中所述第一节点是所述集群的从节点并且所述第一节点与所述第二节点是同一节点,并且促使所述迁移包括:响应于确定所述应用发生故障,向所述集群的主节点发送用于所述迁移的失效备援请求,所述主节点和所述第三节点中的至少一个与所述第一节点彼此异质;以及响应于从所述第三节点接收到指示发起失效备援过程的消息而发起所述迁移。4.根据权利要求3所述的方法,其中所述发起包括:停止与所述应用相关联的服务失效备援单元,所述服务失效备援单元是封装有所述应用的实例和以下至少一项的容器:与所述应用相关联的进程、库和配置信息。5.根据权利要求4所述的方法,其中所述发起包括:解附与所述应用相关联的存储设备。6.根据权利要求4所述的方法,还包括:将所述服务失效备援单元中的以下至少一项存储在存储设备中:与所述应用相关联的进程、库和配置信息。7.根据权利要求1所述的方法,其中所述第一节点是所述集群的主节点并且所述第一节点与所述第二节点是同一节点,并且促使所述迁移包括:响应于确定所述应用发生故障,在所述集群中广播重选所述集群的新主节点的消息;响应于接收到指示所述集群中的第四节点已经被选为所述新主节点的消息,向所述第四节点发送用于所述迁移的失效备援请求,所述第三节点和所述第四节点中的至少一个与所述第一节点彼此异质;以及响应于从所述第三节点接收到指示发起失效备援过程的消息,发起所述迁移。8.根据权利要求1所述的方法,其中所述第一节点是所述集群的从节点并且所述第一节点和所述第二节点是同一节点,所述方法还包括:响应于以下至少一项而在所述集群中广播将所述第一节点选为所述集群的主节点的第一选举请求:在预定时间段内未接收到来自所述集群的当前主节点的信息,以及从所述当前主节点接收到指示重新选举所述集群的主节点的消息。9.根据权利要求8所述的方法,还包括:从所述集群中的第五节点接收将所述第五节点选作所述主节点的第二选举请求;以及基于以下至少一个比较来确定是选择所述第一节点还是选择所述第五节点作为所述主节点:所述第一节点发送所述第一选举请求的第一时间与所述第五节点发送所述第二选举请求的第二时间的比较,所述第一节点的第一启动时间和所述第五节点的第二启动时间的比较,以及所述第一节点的第一互联网协议(IP)地址和所述第五节点的第二IP地址的比较。10.根据权利要求9所述的方法,还包括:响应于确定选择所述第一节点作为所述主节点,递增与所述第一节点相关联的选举计数;以及响应于所述选举计数超过阈值计数,在所述集群中广播指示所述第一节点已经被选为所述主节点的消息。11.根据权利要求1所述的方法,其中所述第一节点是所述集群的主节点并且所述第二节点是所述集群的从节点,并且所述确定包括:确定是否从所述第二节点接收到用于所述迁移的失效备援请求,所述第一节点和所述第三节点中的至少一个与所述第二节点彼此异质。12.根据权利要求11所述的方法,其中促使所述迁移包括:响应于通过确定从所述第二节点接收到所述失效备援请求而确定所述第二节点处的所述应用发生故障,确定所述第三节点是否可用作所述迁移的目的地节点;以及响应于所述第三节点可用作所...

【专利技术属性】
技术研发人员:彭海林邹勇吴鹏
申请(专利权)人:伊姆西公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1