System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及通信,具体而言,涉及一种网络故障处理方法、装置、网络设备及可读存储介质。
技术介绍
1、智能计算是一种结合了人工智能技术和高性能计算的计算模式。智能计算旨在解决复杂的大规模计算问题,特别是在机器学习、深度学习等领域。智算涵盖了从数据处理、模型训练到推理等多个方面,其核心目标是提高计算效率和智能化水平。智算中心是专用用于智能计算的数据中心。
2、随着技术的发展,网络可靠性的要求越来越高。特别是对于智算中心网络这类场景,在ai(artificial intelligence,人工智能)技术日新月异的今天,智算中心网络的发展更是被推向了一个前所未有的高潮。由于智算网络通常会用到大量的光模块等易损部件,因此网络局部故障难以避免。而ai训练由于其分布式计算、长周期运行、实时响应等特点,对网络故障极为敏感。因此在故障发生时缩短故障恢复时间就非常重要。
3、传统技术中,故障恢复主要依赖设备的控制平面完成。当网络设备感知到链路故障或节点故障后,通过路由协议(bgp(border gateway protocol,边界网关协议)/ospf(open shortest path first,开放式最短路径优先)/isis(intermediate system tointermediate system,中间系统到中间系统))向邻居发送协议报文通知路由撤销;当邻居设备收到协议报文,并且更新本地路由表项后业务才能恢复,典型场景收敛时间为秒级,业务丢包时间过长。
4、针对路由协议收敛慢导致业务丢包时间长
技术实现思路
1、本专利技术目的在于提供一种网络故障处理方法、装置、网络设备及可读存储介质。
2、本专利技术的实施例可以这样实现:
3、第一方面,本专利技术提供一种网络故障处理方法,应用于网络设备,所述方法包括:
4、获取故障链路的链路标识;
5、在等价多路径路由ecmp表中查找包含所述故障链路的链路标识的路径链路列表关联的ecmp表项的成员;其中,每一ecmp表项包括多个成员及与每个成员关联的转发路径,所述转发路径与由至少一个链路标识组成的路径链路列表相对应;
6、将所述关联的ecmp表项中的成员的状态置为无效。
7、在可选的实施方式中,所述获取故障链路的链路标识的步骤包括:
8、当接收到网络中的其他网络设备发送的故障通告报文时,从所述故障通告报文中获取所述故障链路的链路标识;
9、当检测到与本网络设备直接连接的链路发生故障时,确定所述故障链路的链路标识,并向网络中的其他网络设备发送携带所述故障链路的链路标识的故障通告报文。
10、在可选的实施方式中,在所述获取故障链路的链路标识的步骤之前,所述方法还包括:
11、通过路由协议学习并计算本网络设备到达各目的前缀的完整路径集合;当每条所述完整路径中都包括两条以上链路时,执行如下创建ecmp表项的操作;
12、依次遍历到达每个目的前缀的完整路径集合中的每一条完整路径;
13、将每条所述完整路径划分为第一子路径和第二子路径,所述第一子路径由所述完整路径前预设个数的链路标识组成,所述第二子路径由所述完整路径中除所述前预设个数的链路标识之外的其余链路标识组成;
14、将到达每个目的前缀的具有相同所述第二子路径的所有完整路径的第一子路径划分至第一子路径组;
15、对所述第一子路径组关联一个第一级ecmp表项;
16、将到达每个目的前缀的第二子路径划分至第二子路径组;
17、对所述第二子路径组关联一个第二级ecmp表项,所述第二级ecmp表项将所述第一级ecmp表项作为成员。
18、在可选的实施方式中,所述通过路由协议学习并计算本网络设备到达各目的前缀的完整路径集合的步骤包括:
19、通过链路状态路由协议学习得到链路状态数据库;
20、通过链路状态数据库得到网络拓扑,通过对网络拓扑进行计算,得到所述网络设备到达各目的前缀包括每一跳邻居链路的链路标识的完整路径集合;或者
21、所述通过路由协议学习并计算本网络设备到达各目的前缀的完整路径集合的步骤包括:
22、接收网络中的其他网络设备通过bgp协议通告的携带链路标识路径属性的路由信息并通过bgp协议通告带有链路标识路径属性的路由信息;
23、从接收的路由信息携带的链路标识路径属性中获取每一跳邻居链路的链路标识;
24、根据获取的每一个路径属性中的所有链路标识生成一个可达的完整路径;
25、根据本网络设备到达目的网段的所有可达的完整路径,获得到达该目的网段所述完整路径集合。
26、在可选的实施方式中,所述对所述第一子路径组关联一个第一级ecmp表项的步骤包括:
27、若所述ecmp表中不存在所述第一子路径组中的每个第一子路径对应的ecmp表项,则在所述ecmp表中新创建一个第一级ecmp表项;
28、将每个所述第一子路径的直连下一跳作为新创建的第一级ecmp表项的成员,将每个所述第一子路径作为新创建的第一级ecmp表项中该成员关联的转发路径。
29、在可选的实施方式中,所述对所述第二子路径组关联一个第二级ecmp表项的步骤包括:
30、若所述ecmp表中不存在所述第二子路径组中每个第二子路径对应的ecmp表项,则在所述ecmp表中新创建一个第二级ecmp表项;
31、在所述ecmp表中查找与所述第二子路径对应的第一子路径组相关联的第一级ecmp表项,将查找的每个第一级ecmp表项的索引作为新创建的第二级ecmp表项的成员,将每个第二子路径作为新创建的第二级ecmp表项中该成员关联的转发路径。
32、第二方面,本专利技术提供一种网络故障处理装置,应用于网络设备,所述装置包括:
33、获取模块,用于获取故障链路的链路标识;
34、查找模块,用于在等价多路径路由ecmp表中查找包含所述故障链路的链路标识的路径链路列表关联的ecmp表项的成员;其中,每一ecmp表项包括多个成员及与每个成员关联的转发路径,所述转发路径与由至少一个链路标识组成的路径链路列表相对应;
35、设置模块,用于将所述关联的ecmp表项中的成员的状态置为无效。
36、第本文档来自技高网...
【技术保护点】
1.一种网络故障处理方法,其特征在于,应用于网络设备,所述方法包括:
2.如权利要求1所述的网络故障处理方法,其特征在于,所述获取故障链路的链路标识的步骤包括:
3.如权利要求1所述的网络故障处理方法,其特征在于,在所述获取故障链路的链路标识的步骤之前,所述方法还包括:
4.如权利要求3所述的网络故障处理方法,其特征在于,
5.如权利要求3所述的网络故障处理方法,其特征在于,所述对所述第一子路径组关联一个第一级ECMP表项的步骤包括:
6.如权利要求3所述的网络故障处理方法,其特征在于,所述对所述第二子路径组关联一个第二级ECMP表项的步骤包括:
7.一种网络故障处理装置,其特征在于,应用于网络设备,所述装置包括:
8.如权利要求7所述的网络故障处理装置,其特征在于,所述获取模块具体用于:
9.一种网络设备,其特征在于,包括处理器和存储器,所述存储器用于存储程序,所述处理器用于在执行所述程序时,实现权利要求1-7中任一项所述的网络故障处理方法。
10.一种计算机可读存储介质
...【技术特征摘要】
1.一种网络故障处理方法,其特征在于,应用于网络设备,所述方法包括:
2.如权利要求1所述的网络故障处理方法,其特征在于,所述获取故障链路的链路标识的步骤包括:
3.如权利要求1所述的网络故障处理方法,其特征在于,在所述获取故障链路的链路标识的步骤之前,所述方法还包括:
4.如权利要求3所述的网络故障处理方法,其特征在于,
5.如权利要求3所述的网络故障处理方法,其特征在于,所述对所述第一子路径组关联一个第一级ecmp表项的步骤包括:
6.如权利要求3所述的网络故障处理方法,其特征在于,所...
【专利技术属性】
技术研发人员:唐勇,
申请(专利权)人:迈普通信技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。