【技术实现步骤摘要】
基于集成异常检测器与根因分析结合的异常数据定位方法
[0001]本专利技术属于异常分析领域,尤其涉及一种基于集成异常检测器与根因分析结合的异常数据定位方法。
技术介绍
[0002]异常检测技术在信用卡欺诈、网络入侵检测、复杂工业设备、医学、航天飞机系统的状态监测、图像视频等实际领域中都有着广泛应用。通过利用异常检测技术,可以发现信用卡盗刷、计算机中的恶意活动入侵、工业设备的运行状态异常等,进而采取合适的措施来保护用户或者设备的安全,提高其可靠性。如今处于大数据时代,计算机的计算能力也大为提高,基于数据驱动的异常检测技术也越来越受到欢迎,被应用到各种任务中,性能表现优异,具有非常大的实际应用价值。
[0003]目前实现异常检测主要有监督异常检测技术、半监督异常检测技术以及无监督异常检测技术。各机器学习算法的性能表现是由其样本数据决定的,与样本的维度、样本大小、样本质量、样本标签等有着重要关系。不同的异常检测算法在不同的样本空间性能表现不同。目前多数的异常检测工作是通过采用单个异常检测技术实现的,单个异常检测器的输出结果直接决定了异常检测工作的质量,具有片面性。
技术实现思路
[0004]专利技术目的:本专利技术所要解决的技术问题是针对如何基于各类设备资源的监控数据,对设备的运行状态进行分析,实时获取设备的健康状况,在检测到设备异常时,立即对异常根因进行定位,帮助运维人员对设备进行预防维护,避免因某一设备资源发生故障而造成不可逆转的后果;以及如何通过在传统运维中结合智能算法,辅助进行异常检测与根因 ...
【技术保护点】
【技术特征摘要】
1.一种基于集成异常检测器与根因分析结合的异常数据定位方法,其特征在于,包括:步骤1,对网络设备监控数据集进行异常检测,获得检测结果;所述异常检测采用集成异常检测器进行检测,所述集成异常检测器由监督异常检测器、半监督异常检测器和无监督异常检测器进行集成学习获得;所述检测结果包括正常结果和异常结果;步骤2,对异常结果进行根因分析,获得异常根因,实现异常数据定位。2.根据权利要求1所述的一种基于集成异常检测器与根因分析结合的异常数据定位方法,其特征在于,步骤1包括:步骤1
‑
1,根据集成异常检测器对网络设备监控数据集的要求,完成网络设备监控数据集分配;所述网络设备监控数据集包括训练集和测试集;步骤1
‑
2:对网络设备监控数据集进行数据预处理;步骤1
‑
3:对预处理后的数据进行特征提取,获得提取后的数据;步骤1
‑
4:分别将提取后的数据输入到集成异常检测器中的监督异常检测器和半监督异常检测器中进行训练和测试,输入到无监督异常检测器中进行测试;步骤1
‑
5:针对测试集,对监督异常检测器、半监督异常检测器和无监督异常检测器的输出结果进行集成决策,获得检测结果。3.根据权利要求1所述的一种基于集成异常检测器与根因分析结合的异常数据定位方法,其特征在于,所述步骤1中监督异常检测器采用极限学习机算法,半监督异常检测器采用单分类极限学习机算法,无监督异常检测器采用孤立森林算法。4.根据权利要求3所述的一种基于集成异常检测器与根因分析结合的异常数据定位方法,其特征在于,所述步骤1
‑
1中网络设备监控数据集分配包括划分数据集、训练集分配和测试集分配;所述网络设备监控数据集的数据属性包括网络响应时间、CPU、内存、带宽利用率、吞吐量、包转发率和端口流量;将网络设备监控数据集划分为5个类别的数据,记为类别0~类别4,其中,类别0代表正常类数据,在网络设备处于正常运行状态下采集获得;类别1代表异常类型1数据,类别2代表异常类型2数据,异常类型1数据和异常类型2数据在网络设备处于经常出现异常运行状态的两种情况下进行采集获得;类别3代表异常类型3数据,类别4代表异常类型4数据,异常类型3数据和异常类型4数据在网络设备处于偶尔出现异常运行状态的两种情况下进行采集获得;另外,异常类型1和异常类型2的两类数据作为已知异常类型的数据,异常类型3和异常类型4的两类数据作为未知异常类型的数据;所述训练集分配如下:对于极限学习机算法,训练集...
【专利技术属性】
技术研发人员:武萌,张晓兵,段林博,艾磊,谢荣平,童彬祥,景天野,李中月,
申请(专利权)人:中国电子科技集团公司第二十八研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。