一种基于生成对抗网络过采样的网络入侵检测方法技术

技术编号：27977434 阅读：27 留言：0更新日期：2021-04-06 14:12

本发明专利技术公开了一种基于生成对抗网络过采样的网络入侵检测方法，先选取网络入侵检测数据集中的主要特征，对主要特征进行数据预处理，得到训练集，再通过CGAN模型对训练集中的不平衡数据过采样，然后输入到网络入侵检测模型中进行训练，训练完成以后使用测试集对网络入侵检测模型进行测试。本发明专利技术通过CGAN模型产生的过采样样本，先解决了数据的不平衡问题以后再对检测模型进行训练，使得检测模型对样本数量较少类别的分类更加准确，以此提高了检测模型整体的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于生成对抗网络过采样的网络入侵检测方法
本专利技术属于网络安全
，更具体的说是涉及一种基于生成对抗网络过采样的网络入侵检测方法。
技术介绍
计算机技术的飞速发展，网络攻击事件频繁发生，越来越多的研究者投入网络入侵检测模型的研究中。网络入侵检测是指对异常的网络流量和活动进行监控，并将其与正常的网络预期行为进行区分。检测模型在实际应用中的检测准确率高度依赖于训练模型的数据集。在实际应用中，由于网络入侵行为并不是时刻都在发生的，所以在进行数据样本捕捉时异常样本数量通常要远少于正常样本，导致大多数的网络入侵检测数据集都存在数据不平衡的问题。直接使用不平衡的数据集对网络入侵检测模型进行训练往往效果不佳，因为它们会导致分类结果偏向于样本数量多的类，使得检测模型准确率下降。因此，如何提供一种基于生成对抗网络过采样的网络入侵检测方法是本领域技术人员亟需解决的问题。
技术实现思路
有鉴于此，本专利技术提供了一种基于生成对抗网络过采样的网络入侵检测方法，通过CGAN模型产生的过采样样本，先解决了数据的不平衡问题以后再对检测模型进行训练，使得检测模型对样本数量较少类别的分类更加准确，以此提高了检测模型整体的准确率。为了实现上述目的，本专利技术采用如下技术方案：一种基于生成对抗网络过采样的网络入侵检测方法，先选取网络入侵检测数据集中的主要特征，对主要特征进行数据预处理，得到训练集，再通过CGAN模型对训练集中的不平衡数据过采样，然后输入到网络入侵检测模型中进行训练，训练完成以后使用测试...

【技术保护点】
1.一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，先选取网络入侵检测数据集中的主要特征，对主要特征进行数据预处理，得到训练集，再通过CGAN模型对训练集中的不平衡数据过采样，然后输入到网络入侵检测模型中进行训练，训练完成以后使用测试集对网络入侵检测模型进行测试。/n

【技术特征摘要】
1.一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，先选取网络入侵检测数据集中的主要特征，对主要特征进行数据预处理，得到训练集，再通过CGAN模型对训练集中的不平衡数据过采样，然后输入到网络入侵检测模型中进行训练，训练完成以后使用测试集对网络入侵检测模型进行测试。

2.根据权利要求1所述的一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，网络入侵检测数据集中的主要特征包括TCP连接基本特征、TCP连接的内容特征、基于时间的网络流量统计特征以及基于主机的网络流量统计特征。

3.根据权利要求1所述的一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，数据预处理包括：非数值型特征属性数值化、数据标准化以及构建标签y集合。

4.根据权利要求1所述的一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，CGAN模型训练完成以后，以训练集中的不平衡数据作为原始数据，结合数据的类别标签对不平衡样本进行过采样，过采样完成后数据集中所有类别样本数量相等。

5.根据权利要求4所述的一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，CGAN模型过采样技术是在GAN模型的基础上，添加一个条件信息，限制GAN模型生成特定条件下的样本以完成数据过采样。

6.根据权利要求5所述的一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，GAN模型由两个神经网络模型组成，一个为生成模型G，一个是判别模型D；GAN模型在训练时，生成模型以随机噪声z～Pz(z)作为输入，然后尽量生成与原始样本符合同一分布的生成样本作为生成模型输出；判别模型的输入由生成样本和原始样本组成，目标是判别出两种样本，输出为概率值，若输入来自原始样本则输出1，若输入来自生成样本则输出0；同时判别模型还会给生成模型一个反馈信息，用于指导生成模型的训练，更新生成模型的参数；生成模型的目标是生成能欺骗判别模型的生成样本，判别模型的目标是判别出生成样本和原始样本，通过不断的对抗训练优化，最终达到一个纳什均衡状态，此时判别模型每次输出的概率值都是0.5，GAN模型达到最优。

7.根据权利要求6所述的一种基于生成对抗网络过采样的网络入侵检测方法，其特征在于，GAN模型损失函数如...

【专利技术属性】
技术研发人员：雷震春，马明磊，杨印根，
申请(专利权)人：江西师范大学，
类型：发明
国别省市：江西;36

全部详细技术资料下载我是这个专利的主人