公开网络节点的故障修复。第一节点加入多播组(102)。通过执行三种操作之一实现加入(104)。首先,使故障修复地址与第一节点相关联,第一节点有效加入把故障修复地址作为多播地址的组。其次,使多播地址与第一节点相关联。第三,交换机的多播端口被映射到第一节点的端口。当第一节点发生故障时(106),执行三种操作之一。如果加入涉及故障修复地址,则使故障修复地址与第二节点相关联,第二节点有效加入该组(114)。如果加入涉及多播地址,则第二节点加入该组,该地址与第二节点相关(110)。如果加入映射交换机的多播端口,则该端口被重映射到第二节点端口(112)。(*该技术在2022年保护过期,可自由使用*)
【技术实现步骤摘要】
本专利技术涉及网络,例如Infiniband网络,特别涉及这种网络内节点的故障修复(failover)。
技术介绍
输入/输出(I/O)网络,例如系统总线,可被用于计算机的处理器,以与诸如网络适配器之类外围设备通信。但是,常见I/O网络的结构,例如外设组件接口(PCI)总线方面的约束,限制了计算机的总体性能。于是,提出了新型的I/O网络。一种已知的新型I/O网络称为Infiniband网络。Infiniband网络用拥有一个或多个路由器的分组交换网络替换目前计算机中的PCI或其它总线。主通道适配器(HCA)耦接处理器和子网,而目标通道适配器(TCA)耦接外设和子网。子网包括至少一个交换机,和使HCA和TCA与交换机连接的链路。例如,简单的Infiniband网络可具有一个交换机,HCA和TCA通过链路与其连接。更复杂的布局也是可能的和可预期的。Infiniband网络的每个端节点包括一个或多个通道适配器(CA),每个CA包含一个或多个端口。每个端口具有由本地子网管理器(SM)分配的本地标识符(LID)。在子网内,LID是唯一的。交换机使用LID在子网内路由分组。数据的每个分组包含源LID(SLID)和目的地LID(DLID),源LID识别把分组注入子网的端口,目的地LID识别Infiniband结构或网络将向该处传送分组的端口。Infiniband网络方法通过定义LID掩码计数(LMC),提供物理端口内的多个虚拟端口。LMC规定当证实分组DLID与其分配的LID相符时,物理端口掩蔽或忽略的LID的最低有效位的数目。但是交换机不忽略这些位。于是,SM能够根据最低有效位,对通过Infiniband结构的不同路径编程。从而,该端口可认为是用于在Infiniband结构内路由目的的2LMC个端口。对于需要无故障的持续可用性的关键应用程序来说,通常要求单个应用程序的故障修复,从而要求通信端点或者端节点的故障修复。Infiniband网络环境中的通信端点与CA端口相关。应用程序使用端点在Infiniband网络内通信,例如与其它应用程序等通信。端点的透明故障修复意味着另一端点按照不干扰网络自身内的通信的方式,接管故障端点的责任。但是,由于对端点寻址的方式的缘故,端点或Infiniband网络内的其它节点的透明故障修复较困难。故障修复要求LID被重新分配给接管故障端口的新端口。但是,新端口通常已具有分配给它的LID。于是,分配额外LID的唯一方式是扩展该端口上的LMC范围,从而确保新的LID落入该范围之内。但是实际上难以扩展端口上的LMC范围,有时需要相当大的开销来确保接管端口能够具有分配给它们的故障端口的LID。于是,LID故障修复被认为是需要透明故障修复的Infiniband网络的成功转出(rollout)的问题和障碍。由于上述原因,需要本专利技术。
技术实现思路
本专利技术涉及使用故障修复或多播地址的网络内节点的故障修复。在本专利技术的一种方法中,网络的第一节点加入具有多播地址的多播组。通过执行三种操作之一实现所述加入。首先,可使故障修复地址与第一节点相关联,从而第一节点有效地加入把故障修复地址作为多播地址的多播组。给故障修复地址的通信通过网络被引向第一节点。其次,可使多播地址与第一节点相关联,从而给多播地址的通信通过网络被引向第一节点。第三,网络的交换机上的多播端口可被映射到第一节点上的端口。给多播地址的通信从交换机上的多播端口被引向第一节点上的端口。当第一节点发生故障时,对应于第一节点加入网络的方法,执行三种操作之一。如果加入使故障修复地址与第一节点关联起来,故障修复地址与第二节点相关,从而第二节点有效地加入多播组,给故障修复地址的通信由第二节点处理。如果加入使多播地址与第一节点相关联,第二节点加入多播组,从而多播地址与第二节点相关,给多播地址的通信由第二节点处理。如果加入把交换机上的多播端口映射到第一节点上的端口,则交换机上的多播端口被重映射到第二节点上的端口。从而给多播地址的通信被引向第二节点上的端口。本专利技术还包括故障修复节点和制造产品。故障修复节点是实现本专利技术方法的节点,而制造产品具有计算机可读介质和所述介质中的实现本专利技术方法的装置。结合附图,根据下面的本专利技术的优选实施例的详细说明,本专利技术的其它特征和优点将是显而易见的。附图说明图1是根据本专利技术的优选实施例的方法的流程图,并被建议打印在颁发专利的第一页上。图2是本专利技术的实施例可结合其实现的Inifiniband网络的图解。图3是本专利技术的实施例可结合其实现的例证Inifiniband系统区网络(SAN)的图解。图4是Inifiniband网络的例证端节点的通信接口的图解。图5和6是表示Inifiniband寻址如何进行的Inifiniband网络的图解。图7是表示本专利技术的实施例如何能够通过使多播组的故障修复地址和/或多播组的多播地址与另一节点相关联,实现网络节点故障修复的方法的流程图。图8是表示图7的实施例的性能的图解。图9是表示本专利技术的实施例如何能够通过把交换机多播端口重映射到另一节点上的端口,实现网络节点故障修复的方法的流程图。图10是表示图9的实施例的性能的图解。具体实施例方式概述图1表示了根据本专利技术的优选实施例的方法100。网络的第一节点最初有效加入多播组(102)。多播组具有多播地址或者故障修复地址。执行三种操作中的至少一种(104)。在第一种模式下,多播地址被分配给第一节点。对多播地址的通信随后可被自动导向第一节点,这里先前可能已手动或自动建立了网络,以便实现这种通信。在第二种模式下,网络的交换机上的多播端口被映射到或者与第一节点上的端口相关联。对多播地址的通信随后可从交换机上的多播端口被导向第一节点上的端口,这里交换机不支持多播。在第三种模式下,故障修复地址被分配给该节点。对故障修复地址的通信随后被自动导向第一节点,这里先前已手动或自动建立了网络,以便实现这种通信。网络最好是Infiniband网络。第一和第二节点可以是这种网络上具有通道适配器(CA)和端口的主机。第一节点随后发生故障(108),从而最好由网络的第二节点实现第一节点的透明故障修复。这可涉及执行三种操作之一。首先,第二节点可加入多播组,从而多播地址也被分配给第二节点(110)。从而给多播地址的通信被导向第二节点以及被导向第一节点(出故障节点),以致第二节点从第一节点接管这种通信的处理。其次,交换机上的多播端口可被重新映射到第二节点上的端口(112)。从而给多播地址的通信被导向第二节点上的端口,以致第二节点接管这种通信的处理。第三,使第二节点与故障修复地址相关联,从而第二节点有效加入多播组(114)。给故障修复地址的通信从而被导向第二节点以及被导向第一节点(出故障的节点),以致第二节点从第一节点接管这种通信的处理。诸如Infiniband子网的子网管理器(SM)之类管理组件可把初始分配给第一节点的多播组的多播地址分配给第二节点。管理组件还可把最初映射到第一节点上端口的交换机的多播端口重新映射到第二节点上的端口。制造品的计算机可读介质中的装置也可实现这种功能。该装置可以是可记录的数据存储介质,调制的载波信号或者另一类型的介质或信号。于是在第一模式中,多播地址被用于单播通信。多播地本文档来自技高网...
【技术保护点】
一种方法,包括:网络的第一节点加入具有多播地址的多播组(102),这里所述加入选自实质上包括下述之一的组:使故障修复地址与第一节点相关联,从而第一节点有效加入把故障修复地址作为多播地址的多播组,给故障修复地址的通信通过网络被 引向第一节点;使多播地址与第一节点相关联,从而给多播地址的通信通过网络被引向第一节点;和把网络的交换机上的多播端口映射到第一节点上的端口,从而给多播地址的通信从交换机上的多播端口被引向第一节点上的端口(104);和当 第一节点发生故障时(108),如果加入使故障修复地址与第一节点相关联,则使故障修复地址与第二节点相关联,从而第二节点有效加入多播组,并且给故障修复地址的通信由第二节点处理(114);如果加入使多播地址与第一节点相关联,网络的 第二节点加入多播组,从而多播地址与第二节点相关联,并且给多播地址的通信由第二节点处理(110);和如果加入把交换机上的多播端口映射到第一节点上的端口,则把交换机上的多播端口重映射到第二节点上的端口,从而给多播地址的通信被引向第二节点 上的端口(112)。...
【技术特征摘要】
...
【专利技术属性】
技术研发人员:维维克卡施雅普,
申请(专利权)人:国际商业机器公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。