用于容错和负载平衡路由的方法、系统和计算机存储介质技术方案

技术编号:12947195 阅读:155 留言:0更新日期:2016-03-02 09:11
描述了用于在存在链路故障的情况下平衡以多根树拓扑配置的网络的通信负载的技术。为子图计算最大流量(通过最小分割),所述子图将源和目的地节点之间的链路上的有效链路容量合并。确定计及链路故障以及多个节点对当前可用的链路容量的共享的有效链路容量。通信被平衡同时充分利用了可用的链路容量,甚至是在部分故障的链路(例如部分故障的链路聚合组LAG)上的可用链路容量。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】容错和负载平衡路由 背景 多根树结构通常被部署在生产数据中心网络(DCN)中以提供高对分带宽。诸如等 价多路径路由之类的负载平衡策略常用于平衡在DCN中的节点(例如商用网络交换机、路 由器)之间的多条并行路径上的数据通信负载。然而,当链路故障发生时,高度对称的DCN 变得不对称。所述不对称性对于现有的通信无察觉路由(oblivious routing)协议的负载 平衡来说是种挑战,因为现有的路由协议被设计成通过最低成本路径解决目的地的可到达 性。这样,现有的负载平衡策略不能同时地平衡通信并充分利用链路容量。因此,出现了网 络拥塞,减少了 DCN中的数据吞吐量。 DCN-般使用在节点之间的逻辑链路。逻辑链路一般被称为链路聚合组(LAG), 其通常由多个物理链路组成。LAG的使用使得负载平衡问题更加复杂,因为LAG中的物理 链路故障导致在逻辑链路中的部分容量损失。现有的路由协议(例如开放最短路径优先 (0SPF))通常不会注意到对逻辑链路的容量的这种改变,并且因此,继续将相同量的负载路 由到降级的LAG,这引起了网络拥塞。 为了通过现有路由协议处理这个问题,整个LAG(包括部分故障的LAG的健康的物 理链路)经常被无效。例如,为了帮助路由协议找到不同的路径以暂时减轻由不平衡的负 载所引起的拥塞,可以禁用附加的链路。然而,牺牲的链路容量经常会导致更大规模的拥 塞,特别是当网络中的总体链路容量被高度利用时。例如,0SPF不恰当地平衡面临不对称 且非链路分离路径上的链路故障的负载,即使LAG中的物理链路故障的信息是可用的。 附图简述 参考附图来描述【具体实施方式】。在附图中,附图标记最左边的数字标识该附图标 记首次出现的附图。在各附图中,使用相同的标号来指示相同的特征和组件。 图1⑷和1 (B)示出网络的示例网络拓扑。 图2㈧和2 (B)示出示例网络中的部分链路故障。 图3(A)_3(C)示出示例网络的子图和经转换的子图。 图4(A)_4(C)示出示例网络中的有效的链路容量。 图5(A)示出示例网络中的节点之间的链路的当前链路容量。图5(B)示出示例网 络中的节点之间的链路的有效链路容量。 图6示出用于确定在节点处的有效链路容量的伪代码的示例。 图7 (A)和7 (B)示出存在链路故障时节点之间的路径上的最大流量。 图8(A)_8(D)示出子图的共同部分减少。 图9是示出示例负载平衡系统的组件的框图。 图10是示出示例负载平衡过程的流程图。 图11是示出一旦检测到故障条件的示例负载平衡过程的流程图。 详细描述 概览 在数据中心网络(DCN)中,在其中节点(例如商用交换机、路由器)和链路一般被 配置为多根树拓扑,具有等价多路径路由(ECMP)的传统的路由协议(诸如开放最短路径优 先(OSPF))必须使用许多到目的地的路径以确定实现通信负载平衡的许多条ECMP条目。这 样,当链路故障发生时,传统的路由协议和负载平衡策略经常不恰当地对到目的地的通信 进行平衡。在DCN拓扑中的各种层级处的节点间的非链路分离路径的误算以及链路竞争的 忽视是传统的通信无察觉负载平衡路由的基础问题的示例。 本公开描述了用于在存在链路故障的情况下基于计算子图的最大流量(通过最 小切割)对被配置为多根树拓扑的网络的通信负载进行平衡的技术,所述子图合并了源/ 目的地节点对之间的链路上的有效链路容量。确定计及链路故障以及多个节点对当前可用 的链路容量的共享(即链路竞争)的有效链路容量。这样,本文描述的负载平衡技术同时 平衡了通信并充分利用了可用的链路容量,所述链路容量包括在部分故障的链路(部分故 障的链路聚合组(LAG))上的可用链路容量。 为了减少最大流量计算的计算复杂度,子图可以包括基于从子图中移除共同部分 所确定的经转换的子图。子图还可以包括经减少的子图集,所述子图集是基于从网络中的 不健康的群集(pod)中区分出健康群集来确定的。在各种实施例中,所确定的最大流量被 用作用以平衡相应节点接口上的负载(例如拆分的通信)的权重。 本公开还描述了至少适用于与链路状态路由类型协议(例如集中式配置以及在 网络的节点间的分布式配置中使用的基于距离-矢量或路径-矢量的路由协议)一起使用 的负载平衡技术, 本文的讨论包括若干章节。每个章节旨在提供提供技术和/或结构的示例,但并 不是要指示必须被使用和/或被执行的元素。名为"示例环境"的章节讨论了多根树网络 拓扑的各方面。名为"示例子图"的章节讨论了使用子图来确定源/目的地节点对中的最 大流量的各方面。名为"有效链路容量"的章节讨论了用于确定链路容量的技术,所述技术 计及存在链路故障的情况下的节点之间的链路共享。名为"复杂度减少"的章节讨论了用 于减少最大流量计算的计算复杂度的技术。名为"示例实现"的章节讨论了用于集中式和 分布式的负载平衡实现的技术,其后是名为"示例负载平衡系统"的从系统角度讨论负载平 衡实现的章节。名为"示例操作方法"的章节讨论了负载平衡方法的示例。简介"结论"在 这些章节之后。该简介是出于方便读者的目的而提供的,而非旨在描述和/或限制权利要 求或本公开的任一章节的范围。 示例环境 图1示出了可在数据中心网络(DCN)环境中使用的节点和链路的多根树拓扑的示 例环境100。胖树拓扑102示出了被配置为节点、链路和计算设备的胖树拓扑的示例DCN的 一部分。同时,虚拟层二(VL2)拓扑104示出了被配置在节点、链路和计算设备的VL2拓扑 中的示例DCN。 在胖树拓扑102中,如所示,层3包括通过通信链路与层2的节点A1-A8相连的节 点C1-C4。如所示,层1包括通过通信链路与层2的节点A1-A8相连的节点T1-T8。层0包 括连接到相关联的节点T1-T8的各种计算设备,例如服务器。胖树拓扑102示出了被分组 到各种群集106、108、110和112中的各种节点和计算设备。例如,群集106包括节点A1、A2 和T2。出于说明的目的,仅示出4个群集106、108、110和112,并仅示出与每个群集相连的 4个层0的计算设备。然而,生产DCN可以互连好几万个服务器,并使用多得多的群集、节点 和链路来提供高对分带宽以支持不同的数据中心应用。作为示例,节点T1-T8可以包括商 业的(例如一般可用的、商业现货供应的、无需定制或专用化的)、相对小、相对低价和/或 相对低端口计数的交换机(例如架顶(Top-of-Rack,ToR)交换机)。作为示例,这样的交 换机可以以例如每个连接lGbps来连接数个到数十个计算设备。节点A1-A8可以包括商用 聚合(Agg)交换机(例如从更低速度连接聚合数据到更高速度连接的点对多点交换机等)。 作为示例,这样的交换机可以将lGbps的连接聚合到lOGbps的连接。节点C1-C4可以包括 商用核心交换机(例如串接交换机、骨干交换机、位于物理核心或网络骨干中的高容量交 换机)或它们的不同组合。作为另一个示例,节点T1-T8、A1-A8和C1-C4可以包括能够利 用如在拓扑102和104中所示的冗余路径聚合不同的群集106、108、110和112中的层0的 设备之间的数据传输的任何类型的商用网络交换机的组合。出于在此讨论的目的并且没有 任何隐含的限制,节本文档来自技高网...

【技术保护点】
一种方法,包括:在配置有可执行指令的一个或多个处理器的控制下:确定有效链路容量,所述有效链路容量计及对网络中的发送节点和接收节点之间的两个或更多路径的链路的当前链路容量的共享;至少部分基于所述有效链路容量来确定所述两个或更多路径的最大流量;以及至少部分基于所述最大流量来确定用于对所述发送节点在所述两个或更多路径上的通信进行负载平衡的权重。

【技术特征摘要】
【国外来华专利技术】

【专利技术属性】
技术研发人员:邬海涛郭传雄张永光袁利华
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1