一种流量识别方法及装置制造方法及图纸

技术编号:35143353 阅读:51 留言:0更新日期:2022-10-05 10:20
本申请提供一种流量识别方法及装置,应用于数据安全技术领域,方法包括:获取待识别流量的流量数据;流量数据包括流统计信息以及流序列信息;将流统计信息以及流序列信息输入流量识别模型中,得到流量识别模型输出的识别结果;流量识别模型包括MLP模型以及双向GRU模型,MLP模型用于对流统计信息进行特征提取得到对应的流统计特征,双向GRU模型用于基于流序列信息的两个方向信息进行序列建模,以对流序列信息进行特征提取得到对应的流序列特征。该模型从流统计信息以及流序列信息两个方面出发,可以从多个角度捕获流量数据的差异,同时利用双向GRU模型捕获序列特征交互以及数据包特征交互关系,因此提高流量识别的准确率。因此提高流量识别的准确率。因此提高流量识别的准确率。

【技术实现步骤摘要】
一种流量识别方法及装置


[0001]本申请涉及数据安全
,具体而言,涉及一种流量识别方法及装置。

技术介绍

[0002]随着互联网技术的快速发展和应用,为了保障用户的隐私和安全,流量加密在当今的互联网上变的更加普遍和重要。同时,这也导致非法分子在互联网上从事恶意行为,通过代理软件或虚拟专用网络(Virtual PrivateNetwork,VPN)隐藏自身的网际互连协议(Internet Protocol,IP)地址逃避国家的监管,严重危害着个人和国家安全。
[0003]Clash是作为一种新型的网络通信加密代理软件,支持多种加密协议,支持动态绑定端口和端口转发等功能,通常被用于代理隐藏身份,具有非常高的隐蔽性和灵活性。由于其产生的流量与正常的流量非常相似,因此难以将Clash流量与正常流量进行区分。
[0004]在现有技术中,一般首先从加密流量数据中提取到流量统计相关信息,然后使用深度学习网络模型对Clash流量进行识别,但是,采用现有的方式对流量进行识别的识别准确率低。

技术实现思路

[0005]本申请实施例的目的在于提供一种流量识别方法及装置,用以解决现有技术中流量识别模型识别准确率低的技术问题。
[0006]第一方面,本申请实施例提供一种流量识别方法,包括:获取待识别流量的流量数据;其中,所述流量数据包括流统计信息以及流序列信息;将所述流统计信息以及所述流序列信息输入流量识别模型中,得到所述流量识别模型输出的识别结果;其中,所述流量识别模型包括MLP模型以及双向 GRU模型,所述MLP模型用于对所述流统计信息进行特征提取得到对应的流统计特征,所述双向GRU模型用于基于所述流序列信息的两个方向信息进行序列建模,以对所述流序列信息进行特征提取得到对应的流序列特征。在上述方案中,在获取到待识别流量对应的流统计信息以及流序列信息之后,可以通过将上述流统计信息以及流序列信息输入流量识别模型中得到待识别流量的流量类型。其中,流量识别模型可以包括MLP模型以及双向GRU模型,由于该模型从流统计信息以及流序列信息两个方面出发,可以从多个角度捕获流量数据的差异,因此可以提高流量识别的准确率。此外,利用双向GRU模型对流序列信息进行特征提取,可以捕获序列特征交互以及数据包特征交互关系,从而提高流量识别的准确率。
[0007]在可选的实施方式中,所述双向GRU模型包括两层双向GRU模型。在上述方案中,利用两层双向GRU模型对流序列信息进行特征提取,可以进一步的捕获序列特征交互以及数据包特征交互关系,从而提高流量识别的准确率。
[0008]在可选的实施方式中,所述流量识别模型还包括MLP分类模型,所述将所述流统计信息以及所述流序列信息输入流量识别模型中,得到所述流量识别模型输出的识别结果,包括:将所述流统计信息输入所述MLP模型中,得到所述流统计特征,以及,将所述流序列信
息输入所述双向GRU模型中,得到所述流序列特征;对所述流统计特征以及所述流序列特征进行特征拼接;将拼接后的特征输入所述MLP分类模型中,并经过softmax函数输出所述识别结果。在上述方案中,可以使用对流统计特征以及流序列特征进行特征拼接的表征方式,从而可以从多个角度捕获流量数据的差异以及特征之间的特征交互关系,因此可以提高流量识别的准确率。
[0009]在可选的实施方式中,所述流序列信息包括数据包序列信息以及负载数据分布序列信息。在上述方案中,流序列信息中的数据包序列信息可以体现数据包传输过程中包信息序列变化行为,而负载数据分布序列信息可以捕获流量数据传输过程中的有效负载数据内容的序列变化行为,从而可以提升流量识别模型对加密流量数据的识别效果,进一步提高流量识别的准确率。
[0010]在可选的实施方式中,所述获取待识别流量的流量数据,包括:获取待识别流量;对所述待识别流量进行分流处理,得到多个数据流;针对每一个数据流,提取所述数据流的流信息、前向包信息以及后向包信息,并基于所述流信息、所述前向包信息以及所述后向包信息确定所述流统计信息,以及,提取所述数据流的流序列信息。在上述方案中,在获取到待识别流量之后,可以先对待识别流量进行分流处理,然后在基于分流处理后,根据得到的数据流提取对应的流统计信息以及流序列信息,以根据上述流统计信息以及流序列信息对待识别流量进行流量识别。
[0011]在可选的实施方式中,所述流量识别方法还包括:获取Clash流量数据以及非Clash流量数据;利用所述Clash流量数据以及所述非Clash流量数据对原始模型进行训练,得到所述流量识别模型。在上述方案中,在对原始模型进行训练得到流量识别模型的过程中,模型可以同时利用流统计信息和流序列信息,并能够自动学习序列特征交互和数据包之间的交互关系,以及,可以从多个角度对数据流数据进行建模,因此,能够有效区分不同流量类型之间的轻微差异信息,并在流量预测的过程中充分利用学习到的特征信息提高Clash流量识别的准确率。
[0012]第二方面,本申请实施例提供一种流量识别装置,包括:第一获取模块,用于获取待识别流量的流量数据;其中,所述流量数据包括流统计信息以及流序列信息;识别模块,用于将所述流统计信息以及所述流序列信息输入流量识别模型中,得到所述流量识别模型输出的识别结果;其中,所述流量识别模型包括MLP模型以及双向GRU模型,所述MLP模型用于对所述流统计信息进行特征提取得到对应的流统计特征,所述双向GRU模型用于基于所述流序列信息的两个方向信息进行序列建模,以对所述流序列信息进行特征提取得到对应的流序列特征。在上述方案中,在获取到待识别流量对应的流统计信息以及流序列信息之后,可以通过将上述流统计信息以及流序列信息输入流量识别模型中得到待识别流量的流量类型。其中,流量识别模型可以包括MLP模型以及双向GRU模型,由于该模型从流统计信息以及流序列信息两个方面出发,可以从多个角度捕获流量数据的差异,因此可以提高流量识别的准确率。此外,利用双向GRU模型对流序列信息进行特征提取,可以捕获序列特征交互以及数据包特征交互关系,从而提高流量识别的准确率。
[0013]在可选的实施方式中,所述双向GRU模型包括两层双向GRU模型。在上述方案中,利用两层双向GRU模型对流序列信息进行特征提取,可以进一步的捕获序列特征交互以及数据包特征交互关系,从而提高流量识别的准确率。
[0014]在可选的实施方式中,所述流量识别模型还包括MLP分类模型,所述识别模块具体用于:将所述流统计信息输入所述MLP模型中,得到所述流统计特征,以及,将所述流序列信息输入所述双向GRU模型中,得到所述流序列特征;对所述流统计特征以及所述流序列特征进行特征拼接;将拼接后的特征输入所述MLP分类模型中,并经过softmax函数输出所述识别结果。在上述方案中,可以使用对流统计特征以及流序列特征进行特征拼接的表征方式,从而可以从多个角度捕获流量数据的差异以及特征之间的特征交互关系,因此可以提高流量识别的准确率。
[0015]在可选的实施方式中,所述流序列信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种流量识别方法,其特征在于,包括:获取待识别流量的流量数据;其中,所述流量数据包括流统计信息以及流序列信息;将所述流统计信息以及所述流序列信息输入流量识别模型中,得到所述流量识别模型输出的识别结果;其中,所述流量识别模型包括MLP模型以及双向GRU模型,所述MLP模型用于对所述流统计信息进行特征提取得到对应的流统计特征,所述双向GRU模型用于基于所述流序列信息的两个方向信息进行序列建模,以对所述流序列信息进行特征提取得到对应的流序列特征。2.根据权利要求1所述的流量识别方法,其特征在于,所述双向GRU模型包括两层双向GRU模型。3.根据权利要求1所述的流量识别方法,其特征在于,所述流量识别模型还包括MLP分类模型,所述将所述流统计信息以及所述流序列信息输入流量识别模型中,得到所述流量识别模型输出的识别结果,包括:将所述流统计信息输入所述MLP模型中,得到所述流统计特征,以及,将所述流序列信息输入所述双向GRU模型中,得到所述流序列特征;对所述流统计特征以及所述流序列特征进行特征拼接;将拼接后的特征输入所述MLP分类模型中,并经过softmax函数输出所述识别结果。4.根据权利要求1

3任一项所述的流量识别方法,其特征在于,所述流序列信息包括数据包序列信息以及负载数据分布序列信息。5.根据权利要求1所述的流量识别方法,其特征在于,所述获取待识别流量的流量数据,包括:获取待识别流量;对所述待识别流量进行分流处理,得到多个数据流;针对每一个数据流,提取所述数据流的流信息、前向包信息以及后向包信息,并基于所述流信息、所述前向包信息以及所述后向...

【专利技术属性】
技术研发人员:殷臣
申请(专利权)人:北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1