【技术实现步骤摘要】
一种深度学习的网络流量分类方法
本专利技术属于网络信息安全
,特别涉及一种基于深度学习的网络流量分类方法。
技术介绍
随着信息技术的蓬勃发展,种类繁多的互联网应用产生的大量流量占用了很多网络资源,在给服务质量带来巨大挑战的同时也给互联网安全产生负面影响。为了高效地利用网络资源并为网络管理者提供有效的管控手段,以辨别应用层协议为目的的网络流量分类技术成为近年来的研究热点问题。在网络流量分类的传统方法中,应用最广的是基于知名端口号(knownports)的流量分类算法、基于特征字匹配的流量分类算法、基于传输层行为模式的流量分类算法。但是随着端口伪造、明文加密等技术的使用以及网络类别环境差别的增大,上述三种分类方法在现阶段已经无法满足对分类的精度要求。机器学习方法不需要对端口进行匹配,也不需要解析流量的有效载荷内容,同时不受网络环境等影响就可以对网络流量进行高精度的分类,故基于机器学习算法的网络流量分类技术成为近年来的研究热点问题。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的缺陷,提供一种基于深度学习的网络流量分类方法。本专利技术的技术方案是,一种基于深度学习的网络流量分类方法,包括如下步骤:(1)网络流量样本数据的获取;采用Libpcap库对网络流量进行捕获;(2)网络流量属性的确定,包括a.网络流量中客户端端口号统计分析;b.网络流量中数据包平均到达时间统计分析;c.网络流量中包含数据包个数统计分析;(3)网络流量样本标记;采用一种基于端口号及特征字匹配的网络流量样本标记算法,该算法先利用IANA的知名端口库判断训练样本中流量的端口号是否为 ...
【技术保护点】
一种基于深度学习的网络流量分类方法,其特征在于,包括如下步骤:(1)网络流量样本数据的获取;采用Libpcap库对网络流量进行捕获;(2)网络流量属性的确定,包括a.网络流量中客户端端口号统计分析;b.网络流量中数据包平均到达时间统计分析;c.网络流量中包含数据包个数统计分析;(3)网络流量样本标记;采用一种基于端口号及特征字匹配的网络流量样本标记算法,该算法先利用IANA的知名端口库判断训练样本中流量的端口号是否为知名端口,再利用特征字匹配技术将非知名端口的流量样本进行深度解析匹配,对未知流样本进行标记;(4)连续数据的离散化;利用基于粗糙集的方法对网络流量样本中连续的数据进行离散化;(5)样本的训练;采用深度学习中的受限玻尔兹曼机,在原始输入特征中抽取低维高度可区分的低维特征作为训练模型的输入,对样本进行训练,使用支持向量机作为回归模型。
【技术特征摘要】
1.一种基于深度学习的网络流量分类方法,其特征在于,包括如下步骤:(1)网络流量样本数据的获取;采用Libpcap库对网络流量进行捕获;(2)网络流量属性的确定,包括a.网络流量中客户端端口号统计分析;b.网络流量中数据包平均到达时间统计分析;c.网络流量中包含数据包个数统计分析;(3)网络流量样本标记;采用一种基于端口号及特征字匹配的网络流量样本标记算法,该算法先利用IAN...
【专利技术属性】
技术研发人员:徐杰,陈训逊,王博,崔佳,王东安,包秀国,
申请(专利权)人:国家计算机网络与信息安全管理中心,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。