【技术实现步骤摘要】
一种基于GAN的不平衡网络入侵数据检测系统及其方法
[0001]本专利技术涉及异常检测
,更具体的说是涉及一种基于GAN的不平衡网络入侵数据检测系统及其方法。
技术介绍
[0002]入侵检测技术概念于1980年由美国专家James.P.Anderson首次提出,Heady将入侵行为看作故意破坏系统资源行为的集合。随着计算机技术的迅速发展以及网络应用的广泛使用,网络威胁的规模和数量也在不断地增加,而且比以往任何时候都更严重,这可能会导致计算机中的重要信息被窃取和篡改,会给用户带来巨大的损失。因此,研究入侵检测对网络是否能安全、稳定地运行具有十分重要的意义。
[0003]然而,通常网络都是在正常情况下运行,出现被入侵或异常的情况很少,庞大的数据集中往往会出现异常类别的样本远远小于正常类别的样本。目前遇到的挑战是如何在样本维度高、样本类别不平衡数据中准确地识别出网络流量的异常行为。
[0004]现有技术中上述问题的解决办法大致分为传统的机器学习方法和深度学习方法。传统的机器学习方法如OC
‑
SVM,IForest等,将网络入侵检测视为一种分类问题。这些方法通常使用数据训练出分类器,将其分为正常类和异常类。但是对于样本类别不平衡问题,它们往往倾向于确保数量多的类别的准确率,导致不能有效地识别出网络流量中的异常行为。由于网络产生的数据的维度越来越高,数据量也越来越大,在其他领域的出色表现以及其具有强大的数据学习和表达能力的深度学习被应用到了网络入侵检测中。这些方法包括CNN,RNN,DN ...
【技术保护点】
【技术特征摘要】
1.一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,包括:GAN
‑
DAE模型、结果输出模块和评价模块;所述GAN
‑
DAE模型包括生成器和鉴别器;所述生成器中的深度自编码器DAE至少依次包括第一编码器、第一解码器和第二编码器;所述第一编码器,用于接收输入样本X并进行第一次编码得到编码后结果Z,并将Z发送至所述第一解码器;所述第一解码器,用于接收Z并进行解码得到解码后结果X
’
,并将X
’
发送至所述第二编码器和所述鉴别器;所述第二编码器,用于接收X
’
并进行第二次编码得到编码后的结果Z
’
;所述鉴别器,用于接收X和X
’
,并判断X
’
是否为正常样本;所述训练模块,用于控制生成器和鉴别器进行相互对抗,优化生成器和鉴别器的代价函数,直至生成器损失最小化,即鉴别器损失最大化;所述误差计算模块:计算将X
’
视为正常样本的误差、X与X
’
之间的误差、以及Z与Z
’
之间的误差;所述结果输出模块,用于根据误差计算模块计算出的误差值的大小来识别待检测数据中是否存在异常;若误差值小于预设阈值,则输出不存在异常结果,若误差值大于预设阈值,则输出存在异常结果;所述评价模块,用于根据评价指标来评价训练好的所述GAN
‑
DAE模型的性能。2.根据权利要求1所述的一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,生成器和鉴别器进行相互对抗的过程为:其中p(z)表示编码后结果Z的分布,p(x)表示输入数据X的分布,D(x)表示数据X来自真实数据分布。3.根据权利要求1所述的一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,所述误差计算模块中的损失函数分别为:计算将X
’
作为输入样本时的误差:计算X与X
’
之间的误差:计算Z与Z
’
之间的误差:其中,g表示二元交叉损失函数,C(X
′
)表示鉴别器将X
′
看作真实样本的概率,α为1。
4.根据权利要求1所述的一种基于GAN的不平衡网络入侵数据检测系统,其特征在于,所述评价指标包括:准确率、精确率、召回率和F1分数;准确率...
【专利技术属性】
技术研发人员:张传雷,刘江涛,李建荣,可婷,张勇进,陈伟,孙迪,丁忠林,
申请(专利权)人:天津市多智信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。