网络流量分类模型训练方法技术

技术编号:39493208 阅读:12 留言:0更新日期:2023-11-24 11:19
本申请提供一种网络流量分类模型训练方法

【技术实现步骤摘要】
网络流量分类模型训练方法、分类方法及训练装置


[0001]本申请涉及网络流量分类领域,尤其涉及一种网络流量分类模型训练方法

分类方法及训练装置


技术介绍

[0002]随着互联网的迅速发展和全球网络的广泛应用,网络流量的规模和复杂性不断增加

在这个数字时代,各种类型的网络应用和服务
(
如网页浏览

视频流媒体

实时通信

云计算等
)
产生了大量的数据流量;同时用户的日常网络活动也日益增加,查资料

音视频

游戏

直播

聊天等,所产生的网络流量也随之增加

其中有拥有数千台设备的大型企业和组织部门所产生的大量业务流量,有局域网环境下的小型部门所产生的通讯流量,有用户日常生活娱乐所产生的应用流量等

为了提供高效的网络服务

优化网络性能和确保网络安全,对网络流量进行准确的分类和识别变得至关重要

[0003]现有的网络流量分类方法容易造成网络流量的包头消息缺失,进而影响网络流量分类的准确性


技术实现思路

[0004]鉴于此,本申请实施例提供了一种网络流量分类模型训练方法

分类方法及训练装置,以消除或改善现有技术中存在的一个或更多个缺陷

[0005]本申请的第一个方面提供了一种网络流量分类模型训练方法,该方法包括:
[0006]选取目标历史网络流量数据集中各个目标历史网络流量数据中的包头数据中的包头特征向量;并选取各个目标历史网络流量数据中的负载数据中的负载特征以转换为负载特征矩阵;其中,所述目标历史网络流量数据集由预先对历史网络流量数据集进行预处理得到;
[0007]根据第一神经网络得到各个所述负载特征矩阵各自对应的多个负载分类得分向量;并根据第二神经网络得到各个所述包头特征向量各自对应的多个包头分类得分向量;其中,所述第一神经网络与所述第二神经网络的网络结构不同;
[0008]根据依次连接的目标全连接层

融合层和输出层对各个所述负载分类得分向量和各个所述包头分类得分向量分别进行加权求和,得到各个所述目标历史网络流量数据各自对应的融合特征向量;
[0009]将各个所述融合特征向量输入网络流量分类器中以得到各个所述融合特征向量各自对应的多个流量类型的概率;
[0010]根据所述目标历史网络流量数据集和各个所述流量类型的概率训练预设的网络流量分类模型,并在训练过程中,基于预设的分类损失函数得到各个所述流量类型的概率的分类损失,并基于该分类损失迭代训练所述网络流量分类模型,以得到用于对网络流量进行分类的目标网络流量分类模型;其中,所述网络流量分类模型包括:所述第一神经网络

第二神经网络

目标全连接层

融合层

输出层和网络流量分类器

[0011]在本申请的一些实施例中,所述在所述分别选取目标历史网络流量数据集中各个目标历史网络流量数据中包头数据中的包头特征向量以及负载数据中的负载特征矩阵之前,还包括:
[0012]基于预设的筛选条件对所述历史网络流量数据集进行筛选以得到第一网络流量数据集;
[0013]去除所述第一网络流量数据集中各个第一网络流量数据中链路层的帧头和帧尾,并屏蔽各个所述第一网络流量数据中的预设字段,以得到第二网络流量数据集;
[0014]将所述第二网络流量数据集中各个第二网络流量数据转换为各自对应的字节向量以得到所述目标历史网络流量数据集

[0015]在本申请的一些实施例中,所述第一网络包括:依次连接的卷积层

第一残差块

第一池化层

第二残差块

第二池化层

第三残差块

第三池化层

第四残差块

第四池化层

第一展平层

第一全连接层和第一激活函数;
[0016]所述卷积层,用于根据输入其中的各个所述负载特征矩阵对应输出得到各自对应的第一负载特征矩阵;
[0017]所述第一残差块,用于根据输入其中的各个所述第一负载特征矩阵对应输出得到各自对应的第二负载特征矩阵;
[0018]所述第一池化层,用于根据输入其中的各个所述第二负载特征矩阵对应输出得到各自对应的第三负载特征矩阵;
[0019]所述第二残差块,用于根据输入其中的各个所述第三负载特征矩阵对应输出得到各自对应的第四负载特征矩阵;
[0020]所述第二池化层,用于根据输入其中的各个所述第四负载特征矩阵对应输出得到各自对应的第五负载特征矩阵;
[0021]所述第三残差块,用于根据输入其中的各个所述第五负载特征矩阵对应输出得到各自对应的第六负载特征矩阵;
[0022]所述第三池化层,用于根据输入其中的各个所述第六负载特征矩阵对应输出得到各自对应的第七负载特征矩阵;
[0023]所述第四残差块,用于根据输入其中的各个所述第七负载特征矩阵对应输出得到各自对应的第八负载特征矩阵;
[0024]所述第四池化层,用于根据输入其中的各个所述第八负载特征矩阵对应输出得到各自对应的第九负载特征矩阵;
[0025]所述第一展平层,用于根据输入其中的各个所述第九负载特征矩阵对应输出得到各自对应的负载特征一维向量;
[0026]所述第一全连接层,用于根据输入其中的各个所述负载特征一维向量对应输出得到多个第一类别;
[0027]所述第一激活函数,用于根据输入其中的各个所述负载特征一维向量和各个所述第一类别对应输出得到各个所述负载特征一维向量各自对应的各个所述负载分类得分向量

[0028]在本申请的一些实施例中,所述第二神经网络包括:依次连接的嵌入层

第二全连接层

第二激活函数

第二展平层

第三全连接层和第三激活函数;
[0029]所述嵌入层,用于根据输入其中的各个所述包头特征向量对应输出得到各自对应的多个包头字节特征向量;
[0030]所述第二全连接层,用于根据输入其中的各个所述包头字节特征向量对应输出得到多个第二类别;
[0031]所述第二激活函数,用于根据输入其中的各个所述包头字节特征向量和各个所述第二类别,对应输出得到各个所述包头特征向量各自对应的各个包头字节得分向量并组成包头字节特征矩阵;
[0032]所述第二展平层,用于根据输入其中的各个所述包头字节特征矩阵对应输出得到各自对应的包头特征一维向量;
[0033]所述第三全连接层,用于根本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种网络流量分类模型训练方法,其特征在于,包括:选取目标历史网络流量数据集中各个目标历史网络流量数据中的包头数据中的包头特征向量;并选取各个目标历史网络流量数据中的负载数据中的负载特征以转换为负载特征矩阵;其中,所述目标历史网络流量数据集由预先对历史网络流量数据集进行预处理得到;根据第一神经网络得到各个所述负载特征矩阵各自对应的多个负载分类得分向量;并根据第二神经网络得到各个所述包头特征向量各自对应的多个包头分类得分向量;其中,所述第一神经网络与所述第二神经网络的网络结构不同;根据依次连接的目标全连接层

融合层和输出层对各个所述负载分类得分向量和各个所述包头分类得分向量分别进行加权求和,得到各个所述目标历史网络流量数据各自对应的融合特征向量;将各个所述融合特征向量输入网络流量分类器中以得到各个所述融合特征向量各自对应的多个流量类型的概率;根据所述目标历史网络流量数据集和各个所述流量类型的概率训练预设的网络流量分类模型,并在训练过程中,基于预设的分类损失函数得到各个所述流量类型的概率的分类损失,并基于该分类损失迭代训练所述网络流量分类模型,以得到用于对网络流量进行分类的目标网络流量分类模型;其中,所述网络流量分类模型包括:所述第一神经网络

第二神经网络

目标全连接层

融合层

输出层和网络流量分类器
。2.
根据权利要求1所述的网络流量分类模型训练方法,其特征在于,所述在所述分别选取目标历史网络流量数据集中各个目标历史网络流量数据中包头数据中的包头特征向量以及负载数据中的负载特征矩阵之前,还包括:基于预设的筛选条件对所述历史网络流量数据集进行筛选以得到第一网络流量数据集;去除所述第一网络流量数据集中各个第一网络流量数据中链路层的帧头和帧尾,并屏蔽各个所述第一网络流量数据中的预设字段,以得到第二网络流量数据集;将所述第二网络流量数据集中各个第二网络流量数据转换为各自对应的字节向量以得到所述目标历史网络流量数据集
。3.
根据权利要求1所述的网络流量分类模型训练方法,其特征在于,所述第一网络包括:依次连接的卷积层

第一残差块

第一池化层

第二残差块

第二池化层

第三残差块

第三池化层

第四残差块

第四池化层

第一展平层

第一全连接层和第一激活函数;所述卷积层,用于根据输入其中的各个所述负载特征矩阵对应输出得到各自对应的第一负载特征矩阵;所述第一残差块,用于根据输入其中的各个所述第一负载特征矩阵对应输出得到各自对应的第二负载特征矩阵;所述第一池化层,用于根据输入其中的各个所述第二负载特征矩阵对应输出得到各自对应的第三负载特征矩阵;所述第二残差块,用于根据输入其中的各个所述第三负载特征矩阵对应输出得到各自对应的第四负载特征矩阵;所述第二池化层,用于根据输入其中的各个所述第四负载特征矩阵对应输出得到各自
对应的第五负载特征矩阵;所述第三残差块,用于根据输入其中的各个所述第五负载特征矩阵对应输出得到各自对应的第六负载特征矩阵;所述第三池化层,用于根据输入其中的各个所述第六负载特征矩阵对应输出得到各自对应的第七负载特征矩阵;所述第四残差块,用于根据输入其中的各个所述第七负载特征矩阵对应输出得到各自对应的第八负载特征矩阵;所述第四池化层,用于根据输入其中的各个所述第八负载特征矩阵对应输出得到各自对应的第九负载特征矩阵;所述第一展平层,用于根据输入其中的各个所述第九负载特征矩阵对应输出得到各自对应的负载特征一维向量;所述第一全连接层,用于根据输入其中的各个所述负载特征一维向量对应输出得到多个第一类别;所述第一激活函数,用于根据输入其中的各个所述负载特征一维向量和各个所述第一类别对应输出得到各个所述负载特征一维向量各自对应的各个所述负载分类得分向量
。4.
根据权利要求1所述的网络流量分类模型训练方法,其特征在于,所述第二神经网络包括:依次连接的嵌入层

第二全连接层

第二激活函数

第二展平层

第三全连接层和第三激活函数;所述嵌入层,用于根据输入其中的各个所述包头特征向量对应输出得到各自对应的多个包...

【专利技术属性】
技术研发人员:陈春丽翟钰尚策孙岩尹涛
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1