System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于多分类神经网络模型的流量识别与关联方法、抗关联性分析方法及装置制造方法及图纸_技高网

基于多分类神经网络模型的流量识别与关联方法、抗关联性分析方法及装置制造方法及图纸

技术编号:43884017 阅读:7 留言:0更新日期:2024-12-31 19:09
本发明专利技术公开了一种基于多分类神经网络模型的流量识别与关联方法、抗关联性分析方法及装置,属于网络安全领域,包括步骤:通过训练多分类神经网络模型的方式从非关联流量中抽取非关联白噪音;通过利用多分类神经网络处理输入流量,同时得到拟关联流量的所属匿名通信网络类别和与非关联白噪音的特征距离,进而同时获得流量识别和流量关联结果。本发明专利技术解决了现有流量识别、关联模型及算法无法同时执行流量识别和流量关联的技术问题,以及在面向不同匿名通信网络执行流量关联任务时,无法通用的技术问题,同时提供一种新颖的、通用的匿名通信网络抗关联性分析技术方案。

【技术实现步骤摘要】

本专利技术涉及网络安全领域,更为具体的,涉及一种基于多分类神经网络模型的流量识别与关联方法、抗关联性分析方法及装置


技术介绍

1、匿名网络流量关联是网络安全领域的重要研究方向,是指对于在匿名网络环境中产生的流量数据进行分析和关联,以此来识别和追踪数据流在网络中的源头和目的地。这个过程涉及到破解或绕过流量的匿名性,实现对于网络行为的跟踪和审计。匿名网络流量关联技术在网络攻击溯源、恶意行为追踪等场景中具有应用价值。

2、现有的匿名网络流量关联方法可以分为基于统计的方法和基于模型的方法。它们都需要将每个数据流抽象为描述流形状的原始特征序列(例如,数据包的大小、时间、方向序列,流量突发)。基于统计的方法使用相关系数或统计距离来衡量进出流序列的相似度。具有最高相似度的流对被认为是相关的。基于模型的方法应用机器学习或深度学习模型来关联数据流,直接将进出流序列放在一起并输入到模型中,然后根据“相关”或“不相关”的二元标签来训练模型。一个训练良好的相关模型将输出输入流对的相关概率,同样地,概率最高的流对被认为是相关的。

3、自匿名通信相关技术提出至今,产生了大量的匿名通信系统,较为典型的有tor、i2p、freenet、netcamo、tarzan等。其中,tor、i2p、freenet三者约占整个市场份额的90%,而tor正式版自2003年发布以来,依托于核心技术“洋葱路由”,现已成为使用范围最广、用户保有量最大的低延时匿名通信系统。由于tor网络使用率最高,长期以来,流量关联技术基本以tor网络作为研究对象,使得攻击模型僵化,输入特征局限。目前最先进的流量关联方法一般只针对tor网络流量有效,例如sun等人的raptor、nasr等人的deepcorr、oh等人的deepcoffea和lopes等人的滑动子集和流量关联方法等。同时也存在少量的针对其他特定类别的匿名通信网络的流量关联方法。在实践中,使用这些方法的前提是首先要识别出拟关联的通信流量所使用的匿名通信网络的类别,然后再应用对应的流量关联方法执行关联行动,这给流量关联任务增添了流量识别环节,从而增加了监控时间需求。


技术实现思路

1、本专利技术的目的在于克服现有技术的不足,提供一种基于多分类神经网络模型的流量识别与关联方法、抗关联性分析方法及装置,解决了现有流量识别、关联模型及算法无法同时执行流量识别和流量关联的技术问题,以及在面向不同匿名通信网络执行流量关联任务时,现有流量关联模型及算法无法通用的技术问题,同时提供一种新颖的、通用的匿名通信网络抗关联性分析技术方案。

2、本专利技术的目的是通过以下方案实现的:

3、一种基于多分类神经网络模型的流量识别与关联方法,包括以下步骤:

4、将在各种匿名通信网络中,彼此没有通信关系的流量之间所具有的共性基础特征作为非关联白噪音;

5、再通过训练多分类神经网络模型的方式从非关联流量中抽取非关联白噪音,实现对非关联共性特征的抽取;通过利用多分类神经网络处理输入流量,同时得到拟关联流量的所属匿名通信网络类别和与非关联白噪音的特征距离,进而同时获得流量识别和流量关联结果。

6、进一步地,多分类神经网络模型的生成训练包括如下子步骤:

7、s1,构建包含多种类匿名通信流量的通信数据集;

8、s2,将通信数据集整理为非关联流量和关联流量;

9、s3,由所述非关联流量信息构建结构化非关联数据集;

10、s4,面向流量关联问题选择多分类神经网络模型;

11、s5,基于所述非关联数据集训练多分类神经网络模型。

12、进一步地,在步骤s1中,所述构建包含多种类匿名通信流量的通信数据集,具体包括子步骤:

13、首先,搭建使用不同种类的匿名通信网络进行通信的通信源与通信目标对;一个通信源只通过一种匿名通信网络与一个通信目标进行通信;

14、再构建多对利用不同种类匿名通信网络相互通信的通信源和通信目标;在任一通信源与其所使用的匿名通信网络的入口中继节点之间、其所使用的匿名通信网络的出口中继节点与对应的通信目标之间,分别设置发送端监听和接收端监听设施,用于实现对通信源流量和通信目标流量的监听采集;收集所采集的所有通信对流量,构成通信数据集。

15、进一步地,在步骤s2中,所述将通信数据集整理为非关联流量和关联流量,具体包括子步骤:

16、在通信数据集中,先将彼此通信的通信源与通信目标流量对集合到一起,成为通信组,通信组流量即为关联流量;

17、再将彼此不通信的通信源与通信目标流量对集合到一起,成为非通信组,非通信组流量即为非关联流量;其中,在构造非通信组时,将通信组中的通信源流量与除了与该通信源进行通信的通信目标之外的所有通信目标流量分别配对,成为非通信组。

18、进一步地,在步骤s3中,所述由所述非关联流量信息构建结构化非关联数据集,具体包括子步骤:

19、从非关联流量中抽取非关联流量信息,构建结构化的非关联数据集;所抽取的流量信息用于执行流量关联操作的输入信息,将抽取出的流量信息在保留原有非关联配对的情况下以结构化的方式组织起来,形成结构化非关联数据集。

20、进一步地,在步骤s4中,所述面向流量关联问题选择多分类神经网络模型,具体包括子步骤:

21、以各种匿名通信网络类型为不同类别,目标是识别出输入的非关联流量对所使用的匿名通信网络的类型。

22、进一步地,在步骤s5中,所述基于所述非关联数据集训练多分类神经网络模型,具体包括子步骤:

23、输入数据准备为从结构化非关联数据集中抽取非关联流量信息序列,作为模型的输入数据;

24、模型计算输出将输入数据经过多分类神经网络运算输出为可能使用的不同匿名通信网络的概率;

25、交叉熵损失函数用于衡量预测概率分布与真实概率分布之间差异的损失函数,同时能够在执行分类时表征分类器对于该次分类的信心程度,损失函数越小表示信心越强;

26、参数调整为通过反向传播算法调整神经网络的参数,通过优化算法,使得损失函数最小化。

27、进一步地,所述通过训练多分类神经网络模型的方式从非关联流量中抽取非关联白噪音,实现对非关联共性特征的抽取;通过利用多分类神经网络处理输入流量,同时得到拟关联流量的所属匿名通信网络类别和与非关联白噪音的特征距离,进而同时获得流量识别和流量关联结果,具体包括如下子步骤:

28、步骤1),采集拟关联双方流量数据:通过监听设施对拟进行流量关联分析的通信源和通信目标的流量进行采集;

29、步骤2),构建通信源流量信息序列和通信目标流量信息序列:将采集到的通信源和通信目标的流量数据整理成流量信息序列;流量信息序列与在多分类神经网络的训练阶段所使用的结构化非关联数据集中的流量信息序列的内容和格式保持一致;

30、步骤3),利用多分类神经网络模型计算得到本文档来自技高网...

【技术保护点】

1.一种基于多分类神经网络模型的流量识别与关联方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,多分类神经网络模型的生成训练包括如下子步骤:

3.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤S1中,所述构建包含多种类匿名通信流量的通信数据集,具体包括子步骤:

4.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤S2中,所述将通信数据集整理为非关联流量和关联流量,具体包括子步骤:

5.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤S3中,所述由所述非关联流量信息构建结构化非关联数据集,具体包括子步骤:

6.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤S4中,所述面向流量关联问题选择多分类神经网络模型,具体包括子步骤:

7.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤S5中,所述基于所述非关联数据集训练多分类神经网络模型,具体包括子步骤:

8.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,所述通过训练多分类神经网络模型的方式从非关联流量中抽取非关联白噪音,实现对非关联共性特征的抽取;通过利用多分类神经网络处理输入流量,同时得到拟关联流量的所属匿名通信网络类别和与非关联白噪音的特征距离,进而同时获得流量识别和流量关联结果,具体包括如下子步骤:

9.一种基于多分类神经网络模型的抗关联性分析方法,其特征在于,包括:

10.一种基于多分类神经网络模型的流量识别与关联装置,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时执行权利要求1~8中任一项所述的方法。

11.一种基于多分类神经网络模型的抗关联性分析装置,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载时执行权利要求9所述的方法。

...

【技术特征摘要】

1.一种基于多分类神经网络模型的流量识别与关联方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,多分类神经网络模型的生成训练包括如下子步骤:

3.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤s1中,所述构建包含多种类匿名通信流量的通信数据集,具体包括子步骤:

4.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤s2中,所述将通信数据集整理为非关联流量和关联流量,具体包括子步骤:

5.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤s3中,所述由所述非关联流量信息构建结构化非关联数据集,具体包括子步骤:

6.根据权利要求1所述的基于多分类神经网络模型的流量识别与关联方法,其特征在于,在步骤s4中,所述面向流量关联问题选择多分类神经网络模型,具体包括子步骤:

7.根据权利要求1所述的基于多分类神经...

【专利技术属性】
技术研发人员:张宇光张位张淑文兰昆张玲毛得明
申请(专利权)人:中国电子科技集团公司第三十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1