一种加密流量分类方法及装置制造方法及图纸

技术编号:39061798 阅读:12 留言:0更新日期:2023-10-12 19:54
本发明专利技术公开了一种加密流量分类方法及装置。其中,方法包括:获取待分类的加密流量;利用预设的剪枝卷积神经网络对所述加密流量进行处理,得到所述加密流量的分类结果。本发明专利技术利用预设的剪枝卷积神经网络自动提取特征,无需手工提取特征,使得剪枝卷积神经网络具有泛化能力,降低了成本。采用剪枝技术对卷积神经网络进行剪枝,保留网络的重要参数,在不影响网络性能的基础上有效降低了网络的规模和计算量。算量。算量。

【技术实现步骤摘要】
一种加密流量分类方法及装置


[0001]本专利技术涉及加密流量分类
,并且更具体地,涉及一种加密流量分类方法及装置。

技术介绍

[0002]随着云计算技术的快速发展,云平台的流量也迅速增加,这些流量大多采用加密技术,原有的流量分类方法已不再有效。自20世纪90年代以来,云计算在互联网行业经历了几十年的发展,云计算服务作为新兴的服务模式,在互联网行业中呈现出强劲的发展趋势。2018年2月,思科发布了第七份云产业年度研究报告,报告显示,互联网用户群体的增长和商业应用的发展,有效推动了云服务在互联网中重要地位的形成。在新兴应用的推动下,网络流量飞速增长。
[0003]自从PRISM监控项目曝光以来,网络通信加密已成为一种不可阻挡的趋势,全球加密网络流量提升。随着加密技术在网络流量中的广泛应用,加密流量在网络中占据了越来越重要的地位。许多恶意软件利用TLS等加密技术对通信流量进行加密,以逃避防火墙和网络入侵检测系统。因此,对加密网络流量进行有效分析,对于维护网络空间安全,提高网络的高可用性具有重要意义。
[0004]到目前为止,学术界和业界已经有了一些成熟的网络流量分类方法。现有的网络流量分类方法可分为四种:基于端口的方法、基于负载的方法、机器学习的方法和深度学习的方法。随着动态端口策略和端口伪装的广泛应用,基于端口的网络流量分类方法越来越不准确。基于有效负载的方法是基于对信息包的应用层有效载荷的可用信息进行分析,这种方法通过解析数据包的有效负载而侵犯了隐私。基于流量统计特征的机器学习方法受加密的影响较小,但是现有的机器学习方法需要人工提取流量特征,并且机器学习模型的规模和计算量都比较大,成本高。
[0005]针对加密流量分类方法需要人工提取特征,模型的规模和计算量大,成本高的缺陷,亟需一种解决方案。

技术实现思路

[0006]针对现有技术中存在的加密流量分类方法需要人工提取特征,模型的规模和计算量大,成本高的技术问题,本专利技术提供一种加密流量分类方法及装置。
[0007]根据本专利技术的一个方面,提供了一种加密流量分类方法,包括:
[0008]获取待分类的加密流量;
[0009]利用预设的剪枝卷积神经网络对所述加密流量进行处理,得到所述加密流量的分类结果。
[0010]可选地,在利用预设的剪枝卷积神经网络对所述加密流量进行处理之前,该方法还包括:
[0011]对所述加密流量进行流量清除、流量分割以及归一化处理,得到数据格式适用于
所述剪枝卷积神经网络的输入数据。
[0012]可选地,对所述加密流量进行流量清除处理,包括下述中的至少一种:
[0013]去除所述加密流量中与流量分类无关的不相关报文;
[0014]去除所述加密流量中的以太网帧头;
[0015]对所述加密流量的IP地址进行掩盖处理。
[0016]可选地,对所述加密流量进行流量分割处理,包括:
[0017]检查所述加密流量的数据包长度;
[0018]当所述加密流量的数据包长度大于预设的截断长度时,将所述加密流量进行分割处理,得到所述截断长度的加密流量;
[0019]当所述加密流量的数据包长度不大于预设的截断长度时,在所述加密流量的末尾填充零,直至所述加密流量的数据包长度等于所述截断长度。
[0020]可选地,获取待分类的加密流量,包括:利用流量镜像技术,复制交换机上行端口的出站流量,得到待分类的所述加密流量。
[0021]可选地,获取待分类的加密流量之前,该方法还包括通过以下操作步骤得到所述预设的剪枝卷积神经网络:
[0022]获取待分类的样本数据,所述样本数据为预先利用流量镜像技术,从交换机上行端口复制得到的出站流量;
[0023]对所述样本数据进行预处理,得到数据格式适用于待训练的卷积神经网络的目标数据;
[0024]确定所述待训练的卷积神经网络各层的神经元的权重的绝对值;
[0025]根据所述绝对值的大小,对所述待训练的卷积神经网络各层的神经元进行排序;
[0026]根据预设的修剪率,修剪不符合要求的神经元之间的连接;
[0027]利用所述目标数据,对经过修剪的卷积神经网络进行训练,得到所述预设的剪枝卷积神经网络。
[0028]可选地,该方法还包括:通过准确度、召回率和F1分数,对每次训练得到的剪枝卷积神经网络进行评价,直至所述剪枝卷积神经网络满足评价条件,停止训练。
[0029]根据本专利技术的另一个方面,提供了一种加密流量分类装置,包括:
[0030]数据获取模块,用于获取待分类的加密流量;
[0031]分类模块,用于利用预设的剪枝卷积神经网络对所述加密流量进行处理,得到所述加密流量的分类结果。
[0032]可选地,该装置还包括预处理模块,用于:对所述加密流量进行流量清除、流量分割以及归一化处理,得到数据格式适用于所述剪枝卷积神经网络的输入数据。
[0033]可选地,所述预处理模块,具体用于执行下述中的至少一种操作步骤:
[0034]去除所述加密流量中与流量分类无关的不相关报文;
[0035]去除所述加密流量中的以太网帧头;
[0036]对所述加密流量的IP地址进行掩盖处理。
[0037]可选地,所述预处理模块,还具体用于:
[0038]检查所述加密流量的数据包长度;
[0039]当所述加密流量的数据包长度大于预设的截断长度时,将所述加密流量进行分割
处理,得到所述截断长度的加密流量;
[0040]当所述加密流量的数据包长度不大于预设的截断长度时,在所述加密流量的末尾填充零,直至所述加密流量的数据包长度等于所述截断长度。
[0041]可选地,所述数据获取模块,具体用于:利用流量镜像技术,复制交换机上行端口的出站流量,得到待分类的所述加密流量。
[0042]根据本专利技术的又一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本专利技术上述任一方面所述的方法。
[0043]根据本专利技术的又一个方面,提供了一种电子设备,所述电子设备包括:处理器;用于存储所述处理器可执行指令的存储器;所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本专利技术上述任一方面所述的方法。
[0044]从而,本专利技术首先获取待分类的加密流量,然后利用剪枝卷积神经网络对输入数据进行处理,得到加密流量的分类结果。本专利技术利用预设的剪枝卷积神经网络自动提取特征,无需手工提取特征,使得剪枝卷积神经网络具有泛化能力,降低了成本。采用剪枝技术对卷积神经网络进行剪枝,保留网络的重要参数,在不影响网络性能的基础上有效降低了网络的规模和计算量,大大降低了加密流量分类的成本。
附图说明
[0045]通过参考下面的附图,可以更为完整地理解本专利技术的示例性实施方式:
[0046]图1是本专利技术一示例性实施例提供的加密流量分类方法的流本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种加密流量分类方法,其特征在于,包括:获取待分类的加密流量;利用预设的剪枝卷积神经网络对所述加密流量进行处理,得到所述加密流量的分类结果。2.根据权利要求1所述的方法,其特征在于,在利用预设的剪枝卷积神经网络对所述加密流量进行处理之前,还包括:对所述加密流量进行流量清除、流量分割以及归一化处理,得到数据格式适用于所述剪枝卷积神经网络的输入数据。3.根据权利要求2所述的方法,其特征在于,对所述加密流量进行流量清除处理,包括下述中的至少一种:去除所述加密流量中与流量分类无关的不相关报文;去除所述加密流量中的以太网帧头;对所述加密流量的IP地址进行掩盖处理。4.根据权利要求2所述的方法,其特征在于,对所述加密流量进行流量分割处理,包括:检查所述加密流量的数据包长度;当所述加密流量的数据包长度大于预设的截断长度时,将所述加密流量进行分割处理,得到所述截断长度的加密流量;当所述加密流量的数据包长度不大于预设的截断长度时,在所述加密流量的末尾填充零,直至所述加密流量的数据包长度等于所述截断长度。5.根据权利要求1所述的方法,其特征在于,获取待分类的加密流量,包括:利用流量镜像技术,复制交换机上行端口的出站流量,得到待分类的所述加密流量。6.根据权利要求1所述的方法,其特征在于,获取待分类的加密流量之前,还包括通过以下操作步骤得到所述预设的剪枝卷积神经网络:获取待分类的样本数据,所述样本数据为预先利用流量镜像技术,从交换机上行端口复制得到的出站流量;对所述样本数据进行预处理,得到数据格式适用于待训练的卷积神经网络的目标数据;确定所述待训练的卷积神经网络各层的神经元的权重的绝对值;根据所述绝对值的大小,对所述待训练的卷积神经网络各层的神经元进行排序;根据预设的修剪率,修剪不符合要求的神经元之间的连接;利用所述目标数据,对经过修剪的卷积神经网络进行训练,得到所述预设的剪枝卷积神经网络。7.根据...

【专利技术属性】
技术研发人员:刘芸杉李二霞王利亢超群李玉凌韩子龙樊勇华许保平朱克琪杜金陵
申请(专利权)人:国网山东省电力公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1