一种面向网络管理系统的故障检测方法及装置制造方法及图纸

技术编号：32200884 阅读：30 留言：0更新日期：2022-02-08 16:07

本发明专利技术公开了一种面向网络管理系统的故障检测方法，包括以下步骤：步骤1、获取原始不均衡网络故障数据集NF，对NF进行压缩和过滤操作，得到处理后数据集NF＇，NF＇包括样本，样本包括两种类型样本，两种类型样本是指非故障样本和故障样本；步骤2、获取不均衡比例I，所述不均衡比例I=非故障样本的数目/故障样本的数目；步骤3、预先设置一个采样后的两种类型样本数目的比例,根据获取新合成故障数据样本的数目N；步骤4、构建新合成故障数据样本的空间分布分配规则；步骤5、构建新合成故障数据样本的合成规则；步骤6、建立XGB

全部详细技术资料下载

【技术实现步骤摘要】
一种面向网络管理系统的故障检测方法及装置

[0001]本专利技术涉及电子、通讯、信息工程类
，特别是一种面向网络管理系统的故障检测方法及装置。

技术介绍

[0002]面对目前越来越复杂化，大型化的网络系统，网络维护的难度也随之成倍递增，一旦网络发生故障，不论是在军事国防方面，还是商业、居民的日常生活方面，都会造成不可估计的损失以及诸多的不便。因此，如何有效利用当前技术，发现故障，诊断故障，恢复故障，对于保证网络管理系统的平稳运行，维持社会环境的正常有序发展，具有重大意义。
[0003]传统的一些数据分析方法面对日益壮大复杂的网络大数据，难以得到令人满意的结果。随着技术的不断进步，机器学习作为一种人工智能的方法被广泛的应用于数据的分析和挖掘中。机器学习在确定学习模型后，需要一定量的数据训练模型后，才可以使用模型。比如对于一个大型的网络系统来说，我们需要使用大量的网络数据（如网络告警、日志数据等等）训练机器学习模型后，才可以使用训练好的模型进行网络故障的检测与诊断。实际上，我们更加关注模型正确检测出网络发生故障的能力，然而在网络故障数据集中，故障数据总数要远远的低于正常数据的总数，一般称这种数据集为不均衡数据集。通常，样本数目多的类别称为多数类，样本数目少的类别称为少数类。
[0004]在分类过程中，传统的机器学习方法如支持向量机、决策树、贝叶斯网络、k 近邻等都是基于整体分类精度最大化而设计的，这往往导致分类时多数类的分类精度较高而对实际应用更重要的少数类的分类精度较低。因此，在进行模型训练之前，...

【技术保护点】

【技术特征摘要】
1.一种面向网络管理系统的故障检测方法,其特征在于，包括以下步骤：步骤1、获取原始不均衡网络故障数据集NF，对NF进行压缩和过滤操作，得到处理后数据集NF＇，NF＇包括样本，样本包括两种类型样本，两种类型样本是指非故障样本和故障样本；步骤2、获取不均衡比例I，所述不均衡比例I=非故障样本的数目/故障样本的数目；步骤3、预先设置一个采样后的两种类型样本数目的比例，，根据获取新合成故障数据样本的数目N，N= 故障样本的数目
‑
非故障样本的数目；步骤4、构建新合成故障数据样本的空间分布分配规则：首先对于故障样本，使用k
‑
means方法聚类划分为K个子簇；其次对于非故障样本和故障样本划分后的各个子簇，分别获取非故障样本的类中心以及故障样本每个子簇的簇中心，得到各子簇簇中心到非故障样本的类中心的类
‑
簇间距离；根据第i子簇簇中心到非故障样本的类中心的类
‑
簇间距离，建立权重值计算公式，根据权重值计算公式和计算出第i子簇的权重值；获取故障样本的第i子簇待新合成的故障数据样本数；步骤5、构建新合成故障数据样本的合成规则：首先以子簇为单位，遍历第子簇中故障样本到该子簇簇中心的距离，故障样本按距离大小升序排列，选取前个故障数据样本作为第子簇的优选样例，根据合成方法，使用合成第子簇的新故障数据样本；其中，，k为基于K近邻算法寻找某一优选样例的k个最近的邻居样本；之后，将各子簇的新故障数据样本加入到NF＇中，获得均衡数据集NFB；步骤6、建立XGB
‑
RF网络故障检测模型：首先，获得NFB中的第个样本特征，利用XGBoost算法构...

【专利技术属性】
技术研发人员：潘成胜，杨雯升，张艳艳，金爱鑫，朱江，
申请(专利权)人：南京信息工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人