System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及云计算,并且具体的,涉及一种应用于分布式云场景下的故障处理的方法、装置、电子设备及存储介质。
技术介绍
1、分布式云是中心云能力的延伸,旨在提供无处不在的云计算服务,满足边缘数据处理,实时计算等就近接入的需求。与中心云相比,分布式云可以在任意位置使用,决定了分布式云短小精悍,超低成本的特点。为了降低成本,分布式云节点支持最低3台设备起步,大量非必要能力通过公网远程连接中心云使用,并对互联网数据中心(internet datacenter,idc)机房的散热、供电等要求大幅度降低,当然不可避免的会导致云节点故障率提升。
2、相关技术中,分布式云节点故障处理流程沿用了中心云的通用流程:所有故障实时处理。但是通用流程适用于节点规模大、故障率低的中心云场景,不适用于分布式云节点规模小、故障率高的场景。具体而言,分布式云节点通过公网链路复用中心云的故障管理系统,公网链路故障会导致整个边缘节点失联,边缘节点内所有设备批量告警。这种设备工作正常,却因为链路中断导致的批量误报,进一步加剧运维压力。
3、因此,如何高效处理设备故障,是分布式云大规模部署场景中亟待解决的问题。
技术实现思路
1、本申请实施例提供了一种故障处理的方法、装置、设备以及存储介质,能够有利于快速发现链路故障导致的边缘节点中设备失联,提高故障处理效率。
2、第一方面,本申请实施例提供了一种故障处理的方法,所述方法应用于分布式云场景,所述分布式云场景包括中心节点和至少一个边缘节点,所述
3、确定所述至少一个边缘节点中不能正常运行的第一设备;
4、获取所述第一设备所属的第一边缘节点的第一通信链路模型,所述第一通信链路模型包括所述中心节点中的检测模块、所述第一边缘节点中的第二设备,以及所述检测模块与所述第二设备之间的用于数据传输的第三设备;
5、检测所述第一通信链路模型中的每个设备的运行状态,确定链路故障信息,所述链路故障信息包括所述第一通信链路模型中的故障设备的信息。
6、第二方面,本申请实施例提供了一种故障处理的装置,所述装置应用于分布式云场景,所述分布式云场景包括中心节点和至少一个边缘节点,所述装置包括:
7、确定单元,用于确定所述至少一个边缘节点中不能正常运行的第一设备;
8、获取单元,用于获取所述第一设备所属的第一边缘节点的第一通信链路模型,所述第一通信链路模型包括所述中心节点中的检测模块、所述第一边缘节点中的第二设备,以及所述检测模块与所述第二设备之间的用于数据传输的第三设备;
9、检测单元,用于检测所述第一通信链路模型中的每个设备的运行状态,确定链路故障信息,所述链路故障信息包括所述第一通信链路模型中的故障设备的信息。
10、第三方面,本申请实施例本申请提供了一种电子设备,包括:
11、处理器,适于实现计算机指令;以及,
12、存储器,存储有计算机指令,计算机指令适于由处理器加载并执行上述第一方面的方法。
13、第四方面,本申请实施例提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,该计算机指令被计算机设备的处理器读取并执行时,使得计算机设备执行上述第一方面的方法。
14、第五方面,本申请实施例提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面的方法。
15、通过上述技术方案,本申请实施例在边缘节点中的第一设备不能正常运行时,获取该边缘节点所属的第一边缘节点对应的第一通信链路模型,该第一通信链路模型包括中心节点中的检测模块、第一边缘节点中的第二设备,以及检测模块与第二设备之间用于数据传输的第三设备,然后对第一通信链路模型中的每个设备的运行状态进行检测,识别出第一通信链路模型中的故障设备。因此,本申请实施例能够在故障发生时,不仅对边缘节点中的设备进行检测,还对中心节点中检测模块与边缘节点的设备之间的通信链路上的各个转发设备进行检测,从而有利于快速发现链路故障导致的边缘节点中设备失联,提高故障处理效率。进一步的,通过快速发现链路故障,能够有利于减少或避免边缘节点中的设备批量报警,降低运维压力。
本文档来自技高网...【技术保护点】
1.一种故障处理的方法,其特征在于,所述方法应用于分布式云场景,所述分布式云场景包括中心节点和至少一个边缘节点,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一通信链路模型包括以所述检测模块为根节点,以所述第二设备为叶子节点,以所述第三设备为中间节点的树状结构;其中,所述树状结构中根节点和中间节点记录其后续设备。
3.根据权利要求2所述的方法,其特征在于,所述检测所述第一通信链路模型中的每个设备的运行状态,确定链路故障信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述从所述根节点对应的所述检测模块开始,依次遍历所述树状节点中各个节点的运行状态,在所述第一通信链路模型中确定所述故障设备,包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.根据权利要求4所述的方法,其特征在于,还包括:
7.根据权利要求1所述的方法,其特征在于,所述确定所述至少一个边缘节点中不能正常运行的第一设备,包括:
8.根据权利要求1所述的方法,其特征在于,还包括:
9.根据权
10.根据权利要求1所述的方法,其特征在于,还包括:
11.根据权利要求10所述的方法,其特征在于,还包括:
12.一种故障处理的装置,其特征在于,所述装置应用于分布式云场景,所述分布式云场景包括中心节点和至少一个边缘节点,所述装置包括:
13.一种电子设备,其特征在于,包括处理器和存储器,所述存储器中存储有指令,所述处理器运行所述指令时,使得所述处理器执行权利要求1-11任一项所述的方法。
14.一种计算机存储介质,其特征在于,包括指令,当其在计算机上运行时,使得所述计算机执行权利要求1-11中任一项所述的方法。
15.一种计算机程序产品,其特征在于,包括计算机程序代码,当所述计算机程序代码被电子设备运行时,使得所述电子设备执行权利要求1-11中任一项所述的方法。
...【技术特征摘要】
1.一种故障处理的方法,其特征在于,所述方法应用于分布式云场景,所述分布式云场景包括中心节点和至少一个边缘节点,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述第一通信链路模型包括以所述检测模块为根节点,以所述第二设备为叶子节点,以所述第三设备为中间节点的树状结构;其中,所述树状结构中根节点和中间节点记录其后续设备。
3.根据权利要求2所述的方法,其特征在于,所述检测所述第一通信链路模型中的每个设备的运行状态,确定链路故障信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述从所述根节点对应的所述检测模块开始,依次遍历所述树状节点中各个节点的运行状态,在所述第一通信链路模型中确定所述故障设备,包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.根据权利要求4所述的方法,其特征在于,还包括:
7.根据权利要求1所述的方法,其特征在于,所述确定所述至少一个边缘节点中不能正常运行的第一设备,包括:
...
【专利技术属性】
技术研发人员:徐兵,陈远,曾君亮,
申请(专利权)人:腾讯云计算北京有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。