一种基于故障传播关系的通信网络故障定位方法及系统技术方案

技术编号:37865871 阅读:8 留言:0更新日期:2023-06-15 20:55
本发明专利技术公开了一种基于故障传播关系的通信网络故障定位方法及系统,属于通信运营商运维技术领域,将故障时刻的告警用传播关系图进行表达,从传播关系图中找到故障的根源设备及根源告警,完成故障根因的定位;通过故障处置工单数据做训练模型校正,不断迭代更新,优化调整;该方法的实现包括:构建告警类型依赖关系图,基于告警类型依赖关系图和网元设备资源拓扑图构建基于拓扑的告警传播关系图,构建故障训练数据集,神经网络模型训练,以及训练模型优化迭代。本发明专利技术能够提升故障定位准确率,降低故障定位耗时,减少运维工作对专家经验的依赖性。依赖性。依赖性。

【技术实现步骤摘要】
一种基于故障传播关系的通信网络故障定位方法及系统


[0001]本专利技术涉及通信运营商运维
,具体地说是一种基于故障传播关系的通信网络故障定位方法及系统。

技术介绍

[0002]运营商网络存在异厂家多型号设备协同服务,多制式共存融合组网的复杂情况;且在5G、NFV、SDN、云网融合、算力网络等新技术、新业务的驱动下,组网结构由平面组网向立体组网模式演变,网络运维管理难度呈指数级增加。
[0003]当网元设备发生故障时,会通过OMC(操作维护中心)、EMS(网元管理系统)等底层网管平台上报告警数据,同时与其邻近的网元设备受其的影响,也会发出相关联的告警数据。目前上层网管从各个底层网管平台中接收告警数据做集中监控,各平台上报告警相互影响,告警间关系盘根错节、千丝万缕;通过人工方式排查定位时间周期长、专家经验依赖程度高、定位准确率低;而网络、业务的不断更新,使得人工经验的学习成本变高;如何准确的基于告警数据定位真实发生故障的网元设备及其相应的处理措施,成为客户的痛点。

技术实现思路

[0004]本专利技术的技术任务是针对以上不足之处,提供一种基于故障传播关系的通信网络故障定位方法及系统,能够提升故障定位准确率,降低故障定位耗时,减少运维工作对专家经验的依赖性。
[0005]本专利技术解决其技术问题所采用的技术方案是:
[0006]一种基于故障传播关系的通信网络故障定位方法,将故障时刻的告警用传播关系图进行表达,从传播关系图中找到故障的根源设备及根源告警,完成故障根因的定位;通过故障处置工单数据做训练模型校正,不断迭代更新,优化调整;该方法的实现包括:
[0007]构建告警类型依赖关系图;
[0008]基于告警类型依赖关系图和网元设备资源拓扑图构建基于拓扑的告警传播关系图;
[0009]将故障工单数据和告警传播关系图串接,提取故障告警数据及工单处理结论数据,构建故障训练数据集;
[0010]三层神经网络模型训练,将故障训练数据集数据作为输入,使用三层神经网络进行模型训练,使用正确率、召回率、F值进行模型评估;
[0011]训练模型优化迭代,通过故障数据、工单数据持续获取,不断丰富告警类型依赖关系图,采用迁移学习,不断优化模型精度。
[0012]该方法利用运营商网络管理系统中故障日常处理涉及的告警数据、资源数据、工单数据及基于专家经验梳理的已有规则;先利用专家经验规则组织告警依赖关系图,再将已有的历史故障进行实例化建立故障传播关系图,最后将故障传播关系图实例输入神经网络进行训练,生成故障的定位模型,将工单数据作为标注数据,持续进行迭代优化;当故障
再次发生时,将故障传播关系图实例输入定位模型,完成故障根因的定界定位。
[0013]将本定位方法嵌入生产、维护流程,实现故障根因的快速锁定,解决了人工故障定位排查周期长,人工经验依赖程度高的问题,提升网络运维的自动驾驶水平。
[0014]优选的,所述构建告警类型依赖关系图,图中以结点{Node
i
},i=1,

,N表示为告警类型,其中N是结点数,即告警类型数目;以有向边<A,B>表示从节点A到节点B(两个告警类型或系统组件)的触发关系。
[0015]优选的,所述构建基于拓扑的告警传播关系图,
[0016]网元设备资源拓扑图描述设备之间存在的物理连接关系,在网元设备资源拓扑图上基于所述告警类型依赖关系图,构建故障设备告警类型集合的告警传播(子)图;告警传播关系图为以故障设备为起点中心半径≤R的网元设备节点集合,每个告警在R步内,至少被遍历一次;超过R则认为网元设备如果出现的故障类型和当前在故障类型没有关系。
[0017]优选的,R默认值为2,后续根据依赖关系设定可能会有变化。
[0018]优选的,将故障工单数据和告警传播关系图中各结点的告警信息以深度优先/宽度优先遍历串接,提取故障告警数据及工单处理结论数据。
[0019]优选的,所述三层神经网络包括输入层、隐藏层和输出层,是按误差逆向传播算法训练的多层前馈网络,输入层输入数据是故障告警数据,输出层输出可能结论(设备结点)以及每一类可能结论的概率,,神经网络的层数为三层;
[0020]输入层的神经元数量与故障告警数据的维度相关,输出层的神经元数量与结论的种类相关,神经元的数量根据业务情况进行调整;对数据进行随机乱序处理,提取60%的数据作为训练数据,20%数据作为验证数据,20%数据作为测试数据,使用上述数据对神经网络进行训练;通过采用正确率、召回率、F值进行模型评价,完成模型的训练。
[0021]优选的,所述训练模型优化迭代,通过故障定位模型对通信网络出现的故障进行准确定位,减少故障定位过程对专家经验的依赖程度,使其成为网络故障日常运维的有力支撑。
[0022]优选的,所述神经网络模型训练的实现包括数据获取、数据存储、模型训练和模型管理,
[0023]所述数据获取获取标记训练数据和真实数据;
[0024]所述数据存储分别对应标记训练数据和真实数据形成训练数据集和预测数据集;
[0025]所述模型训练,根据训练数据集实现神经网络模型训练及训练模型优化迭代;并结合所述预测数据集形成多分类模型;
[0026]所述模型管理包括模型加载、模型部署和模型预测。
[0027]进一步的,通过模型调用API接口直接调用所述神经网络模型进行故障根因定位。
[0028]本专利技术还要求保护一种基于故障传播关系的通信网络故障定位系统,包括构建告警类型依赖关系图模块、构建基于拓扑的告警传播关系图模块,故障训练数据集模块、神经网络模型训练模块以及训练模型的优化模块,
[0029]所述构建告警类型依赖关系图模块,构建告警类型依赖关系图;
[0030]所述构建基于拓扑的告警传播关系图模块,基于告警类型依赖关系图和网元设备资源拓扑图构建基于拓扑的告警传播关系图;
[0031]所述故障训练数据集模块,将故障工单数据和告警传播关系图串接,提取故障告
警数据及工单处理结论数据,构建故障训练数据集;
[0032]所述神经网络模型训练模块,将故障训练数据集数据作为输入,使用三层神经网络进行模型训练,使用正确率、召回率、F值进行模型评估;
[0033]所述训练模型优化迭代模块,通过故障数据、工单数据持续获取,不断丰富告警类型依赖关系图,采用迁移学习,不断优化模型精度;
[0034]该系统通过上述的基于故障传播关系的故障根因定位方法实现故障根因定位。
[0035]本专利技术的一种基于故障传播关系的通信网络故障定位方法及系统与现有技术相比,具有以下有益效果:
[0036]本方法通过机器学习算法对已发历史故障处理过程进行分析,得出故障的真实原因,用于指导后续故障的根因定位,缩短运营商网络故障定位耗时、提高故障定位准确度、提升故障的处理效率。
[0037]本方法从运营商本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于故障传播关系的通信网络故障定位方法,其特征在于,将故障时刻的告警用传播关系图进行表达,从传播关系图中找到故障的根源设备及根源告警,完成故障根因的定位;通过故障处置工单数据做训练模型校正,不断迭代更新,优化调整;该方法的实现包括:构建告警类型依赖关系图;基于告警类型依赖关系图和网元设备资源拓扑图构建基于拓扑的告警传播关系图;将故障工单数据和告警传播关系图串接,提取故障告警数据及工单处理结论数据,构建故障训练数据集;神经网络模型训练,将故障训练数据集数据作为输入,使用三层神经网络进行模型训练,使用正确率、召回率、F值进行模型评估;训练模型优化迭代,通过故障数据、工单数据持续获取,不断丰富告警类型依赖关系图,采用迁移学习,不断优化模型精度。2.根据权利要求1所述的一种基于故障传播关系的通信网络故障定位方法,其特征在于,所述构建告警类型依赖关系图,图中以结点{Node
i
},i=1,

,N表示为告警类型,其中N是结点数,即告警类型数目;以有向边<A,B>表示从节点A到节点B的触发关系。3.根据权利要求2所述的一种基于故障传播关系的通信网络故障定位方法,其特征在于,所述构建基于拓扑的告警传播关系图,网元设备资源拓扑图描述设备之间存在的物理连接关系,在网元设备资源拓扑图上基于所述告警类型依赖关系图,构建故障设备告警类型集合的告警传播图;告警传播关系图为以故障设备为起点中心半径≤R的网元设备节点集合,每个告警在R步内,至少被遍历一次;超过R则认为网元设备如果出现的故障类型和当前在故障类型没有关系。4.根据权利要求3任一所述的一种基于故障传播关系的通信网络故障定位方法,其特征在于,所述R默认值为2。5.根据权利要求1所述的一种基于故障传播关系的通信网络故障定位方法,其特征在于,将故障工单数据和告警传播关系图中各结点的告警信息以深度优先/宽度优先遍历串接,提取故障告警数据及工单处理结论数据。6.根据权利要求1

5任一项所述的一种基于故障传播关系的通信网络故障定位方法,其特征在于,所述三层神经网络包括输入层、隐藏层和输出层,是按误差逆向传播算法训练的多层前馈网络,输入层输入数据是故障告警数据,输出...

【专利技术属性】
技术研发人员:张召路高德亮
申请(专利权)人:浪潮通信信息系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1