一种虚拟网络设备管理方法及装置制造方法及图纸

技术编号:9254890 阅读:126 留言:0更新日期:2013-10-16 21:20
本发明专利技术提供一种虚拟网络设备管理方法,该方法包括以下步骤:在级联数据通道上感知到虚拟网络设备发生故障且分裂时发送分裂通知;根据分裂通知,通过级联控制通道与其他新虚拟网络设备的主设备交互各自所属虚拟网络设备的有效性控制信息;在收到有效性控制信息后根据预设的有效性协商规则确定本虚拟网络设备的状态,若确定本虚拟网络设备为业务有效状态,则保持本虚拟网络设备中各成员设备的业务处理能力,若确定本虚拟网络设备的状态为业务禁用状态,则将本虚拟网络设备中各成员设备的业务处理去使能。本发明专利技术大大简化了多Active冲突的处理机制,且实施效果明显好于现有技术。

【技术实现步骤摘要】
一种虚拟网络设备管理方法及装置
本专利技术涉及网络通信技术,尤其涉及一种虚拟网络设备管理方法及装置。
技术介绍
虚拟网络设备技术通常用于将多个物理设备虚拟为一台网络设备,从而提高网络设备部署的可扩展性,达到保护用户过往投资的目的。申请人提出的IRF(IntelligentResilientFramework,智能弹性架构)就是一种流行虚拟网络设备。IRF技术通过将多台设备借由IRF物理端口连接在一起,进行必要的配置后,虚拟化成一台“分布式设备”。IRF包括多个成员设备,成员设备有两种角色:Master设备(主设备)以及Slave设备(从设备)。Master设备负责整个IRF的运行、管理和维护;Slave设备主要用于处理业务和作为Master设备的备份。该技术主要有以下几个优点:1.管理简化:IRF形成之后用户通过任意成员设备的任意端口都可以登录IRF系统,对IRF内所有成员设备进行统一管理;因此在管理操作上,相较于传统网络设备更加灵活。2.高可靠性:一旦Master设备故障,其他Slave设备会迅速自动选举新Master设备,以保证业务不中断,从而实现了设备的1:N备份。成员设备之间的IRF链路支持聚合功能,多条链路之间可以互为备份也可以进行负载分担,从而进一步提高了IRF的可靠性。3.扩展能力强:通过增加成员设备,可以快速地提高整个IRF的业务处理能力。在实际运行过程中,IRF系统通常将经历物理连接、拓扑收集、角色选举、IRF的管理与维护四个阶段。成员设备之间需要先建立IRF物理连接,然后会自动进行拓扑收集和角色选举,完成IRF的建立,此后进入IRF的管理和维护阶段。IRF的连接拓扑有两种:链形连接和环形连接。链形连接对成员设备的物理位置要求比环形连接低,主要用于成员设备物理位置分散的组网。环形连接比链形连接更可靠。因为当链形连接中出现链路故障时,会引起IRF分裂;而环形连接中某条链路故障时,会形成链形连接,IRF的业务不会受到影响。在IRF中,每个成员设备和邻居成员设备通过交互IRFHello报文来收集整个IRF的拓扑。IRFHello报文会携带拓扑信息,具体包括IRF端口连接关系、成员设备编号、成员设备优先级、成员设备的桥MAC等内容。每个成员设备参与IRF控制层面的操作是由本地主用主控模块负责的。每个成员设备在本地记录自身已知的拓扑信息。设备刚启动时,本地主用主控模块只记录了自身的拓扑信息。当IRF端口状态变为up后,本地主用主控模块会启动拓扑收集操作,经过一段时间的收集,所有成员设备都会收集到完整的拓扑信息。此时会进入角色选举阶段。IRF中角色选举会在以下情况下进行:IRF建立、Master设备离开或者故障、IRF合并等。在角色选举完成后,IRF形成,进入IRF管理与维护阶段。角色选举完成之后,IRF可投入运作,所有的成员设备组成一台虚拟设备存在于网络中,所有成员设备上的资源归该虚拟设备拥有并由Master设备统一管理。如果某成员设备故障或者IRF链路故障,其邻居设备会立即将"成员设备离开"的信息广播通知给IRF中的其它设备。获取到离开消息的成员设备会根据本地维护的IRF拓扑信息表来判断离开的是Master还是Slave,如果离开的是Master,则触发新的角色选举,再更新本地的IRF拓扑;如果离开的是Slave,则直接更新本地的IRF拓扑,以保证IRF拓扑能迅速收敛。然而由于角色选举是自动进行的,因此在IRF出现链路故障等意外情况时,有可能会导致一个IRF分裂为多个新的IRF。比如说一个链型拓扑从中间分裂开,或者一个环形拓扑同时发生两个链路故障等。这些新IRF会使用原有的IRF配置,这就会导致多个新IRP使用相同的IP地址等三层配置,显然这会引起IP地址冲突,使得单点故障引发整体网络问题。为了解决上述问题,现有技术提出了MAD(Multi-ActiveDetection,多Active检测)技术来应对。MAD技术通常会通过LACP(LinkAggregationControlProtocol,链路聚合控制协议)、BFD(BidirectionalForwardingDetection,双向转发检测)、ARP(AddressResolutionProtocol,地址解析协议)或者ND(NeighborDiscoveryProtocol,邻居发现协议)等各种协议来检测网络中是否存在多个IRF。多Active检测这个问题不仅仅是IRF所面临的挑战,同样是其他基于其他技术架构的虚拟网络设备所面临的问题。目前虽然已经有了比较丰富的解决Active冲突检测和处理的机制,然而这些现有的技术还面临以下的各种各样的困境(仍然以IRF为例):在成员设备之间交互的IRF协议报文,经由IRF成员设备间IRF链路来传输,这无疑会占用该链路上级联数据通道的带宽;尤其是IRF链路拓扑发生变化时,大量协议报文会冲击需要跨框转发(也就是跨成员设备转发)的数据报文的转发处理。虽然现有的MAD检测技术可以尽量避免多个新IRF冲突(也就是多Active冲突)的问题,但这些MAD技术通常都有各自应用场景的限制,并且是可能要消耗更多系统资源(比如IP地址等)或者转发带宽。请参考图1,对于LCAPMAD方式而言,组网中需要使用支持LACP协议扩展功能的中间设备。请参考图2,对于BFDMAD而言,所有成员设备之间必须有一条BFDMAD检测链路,这些链路连接的接口必须属于同一VLAN,在该VLAN接口视图下给不同成员设备配置同一网段下的不同IP地址。请参考图1的组网方式,对于ARPMAD而言,与LCAP方式不同的是,ARPMAD不需要中间设备支持LCAP,但是却需要中间设备、Master和Slave上都要配置生成树功能(STP),以防止形成环路。此外,当IRF检测到其他Active状态(业务有效状态)的IRF时,为了避免冲突,需要关闭某些IRF成员设备的所有业务端口,使之处于Recovery状态(业务禁用状态),这种处理流程可以避免问题向网络中扩散,但是目前的MAD术没有较好的算法来选择需要设置为Recovery状态的IRF成员设备。同时对于Recovery状态的IRF成员设备,必须重启该IRF成员设备才可以重新建立IRF连接。
技术实现思路
有鉴于此,本专利技术提供一种虚拟网络设备管理装置,应用于虚拟网络设备中的成员设备上,其中成员设备包括级联数据端口以及级联控制端口,成员设备的级联数据端口与邻居成员的级联数据端口通过级联数据链路相连以提供级联数据通道;该成员设备的级联控制端口与邻居成员的级联控制端口通过级联控制链路相连以提供物理上独立于该级联数据通道的级联控制通道;该装置包括:第一故障感知单元,用于在级联数据通道上感知到虚拟网络设备发生故障且分裂为多个新虚拟网络设备时向第一控制单元发送分裂通知;第一控制单元,用于通过级联控制通道与其他成员设备进行控制交互;其中第一控制单元进一步用于在本成员设备作为新虚拟网络设备的主设备时,根据第一故障感知单元发送的分裂通知,通过级联控制通道与其他新虚拟网络设备的主设备交互各自所属虚拟网络设备的有效性控制信息;并在收到来自其他虚拟网络设备的有效性控制信息后根据预设的有效性协商规则确定本本文档来自技高网
...
一种虚拟网络设备管理方法及装置

【技术保护点】
一种虚拟网络设备管理装置,应用于虚拟网络设备中的成员设备上,其中成员设备包括级联数据端口以及级联控制端口,成员设备的级联数据端口与邻居成员的级联数据端口通过级联数据链路相连以提供级联数据通道;该成员设备的级联控制端口与邻居成员的级联控制端口通过级联控制链路相连以提供物理上独立于该级联数据通道的级联控制通道;其特征在于,该装置包括:第一故障感知单元,用于在级联数据通道上感知到虚拟网络设备发生故障且分裂为多个新虚拟网络设备时向第一控制单元发送分裂通知;第一控制单元,用于通过级联控制通道与其他成员设备进行控制交互;其中第一控制单元进一步用于在本成员设备作为新虚拟网络设备的主设备时,根据第一故障感知单元发送的分裂通知,通过级联控制通道与其他新虚拟网络设备的主设备交互各自所属虚拟网络设备的有效性控制信息;并在收到来自其他虚拟网络设备的有效性控制信息后根据预设的有效性协商规则确定本虚拟网络设备的状态,若确定本虚拟网络设备为业务有效状态,则保持本虚拟网络设备中各成员设备的业务处理能力,若确定本虚拟网络设备的状态为业务禁用状态,则将本虚拟网络设备中各成员设备的业务处理去使能。

【技术特征摘要】
1.一种虚拟网络设备管理装置,应用于虚拟网络设备中的成员设备上,其中成员设备包括级联数据端口以及级联控制端口,成员设备的级联数据端口与邻居成员的级联数据端口通过级联数据链路相连以提供级联数据通道;该成员设备的级联控制端口与邻居成员的级联控制端口通过级联控制链路相连以提供物理上独立于该级联数据通道的级联控制通道;其特征在于,该装置包括:第一故障感知单元,用于在级联数据通道上感知到虚拟网络设备发生故障且分裂为多个新虚拟网络设备时向第一控制单元发送分裂通知;第一控制单元,用于通过级联控制通道与其他成员设备进行控制交互;其中第一控制单元进一步用于在本成员设备作为新虚拟网络设备的主设备时,根据第一故障感知单元发送的分裂通知,通过级联控制通道与其他新虚拟网络设备的主设备交互各自所属虚拟网络设备的有效性控制信息;并在收到来自其他虚拟网络设备的有效性控制信息后根据预设的有效性协商规则确定本虚拟网络设备的状态,若确定本虚拟网络设备为业务有效状态,则保持本虚拟网络设备中各成员设备的业务处理能力,若确定本虚拟网络设备的状态为业务禁用状态,则将本虚拟网络设备中各成员设备的业务处理去使能。2.如权利要求1所述的装置,其特征在于,所述第一故障感知单元,进一步用于在感知到导致虚拟网络分裂的故障恢复后向第一控制单元发送分裂恢复通知;所述第一控制单元进一步用于在本成员设备为有效虚拟网络设备的主设备,在收到的分裂恢复通知后通过级联控制通道向处于业务禁用状态的虚拟网络设备中的各成员设备发送业务恢复通知,以指示该些成员设备使能业务处理。3.如权利要求1所述的装置,其特征在于,还包括:邻居交互单元,用于分别通过级联控制通道以及级联数据通道与邻居成员设备交互邻居握手报文。4.如权利要求3所述的装置,其特征在于,还包括:拓扑初始化单元,用于在初始化的时候从级联数据通道上接收到的邻居握手报文中获取第一初始拓扑结构数据,从级联控制通道接收到的邻居握手报文中获取第二初始拓扑结构数据;并在第一初始拓扑结构与第二初始拓扑结构不同时向管理者告警。5.如权利要求1所述的装置,其特征在于,还包括:第二控制单元以及第二故障感知单元,其中第二故障感知单元,用于在级联控制通道上感知到故障时,将第一控制单元从使能状态修改为去使能状态,将第二控制单元从去使能状态修改为使能以替代第一控制单元;并用于在级联控制通道上的故障恢复时,将第二控制单元从使能状态修改为去使能状态,将第一控制单元从去使能状态修改为使能以替代第二控制单元;第二控制单元,用于通过级联数据链路与其他成员设备进行控制交互,且其处理分裂通知以及分裂恢复通知的方式与第一控制单元不同。6.如权利要求1所述的装置,其特征在于,所述级联控制端口位于成员设备的主控板上,所述级联数据端口位于成员设备的接口板上。7.如权利要求1所述的装置,其特征在于,所述虚拟网络设备为弹性智能架构IRF。8.如权利要求1所述的装置,其中所述有效性...

【专利技术属性】
技术研发人员:田妍君
申请(专利权)人:杭州华三通信技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1