System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种基于混合特征融合与轻量设计的隐私保护流量分类方法,属于网络安全和数据隐私保护。
技术介绍
1、加密流量分类(encrypted traffic classification,etc)在网络管理和数据隐私保护领域具有重要意义。近年来,互联网加密流量比例迅速增加,ssl/tls协议的广泛应用使得加密流量分类成为网络安全中的关键研究领域。当前,用户隐私意识的增强推动了加密协议、虚拟专用网络(vpn)和匿名网络(tor)等技术的广泛使用。尽管这些技术提高了数据隐私性,但也使传统的流量分类方法(如基于端口的分类和深度包检测)难以有效应对。
2、现有流量分类方法主要分为基于机器学习(ml)和深度学习(dl)的模型。基于机器学习(ml)依赖于流量的统计特征,需进行繁琐的特征工程,并依赖领域专家经验;而dl方法通过自动特征学习减少了特征工程的负担,但其复杂结构和计算资源需求限制了其在资源受限设备上的应用。近年来的轻量化深度学习(dl)虽然在降低计算复杂度方面取得了一定成效,但其分类精度和隐私保护性能仍难以满足实际需求。
3、为应对这些挑战,研究人员提出了一些轻量级的加密流量分类方法。这些方法在减少模型规模和输入数据量方面取得了一定成效,但它们的分类精度仍未能满足实际需求。例如,fasttraffic提出了一种基于深度学习(dl)的轻量级加密流量分类方法(xu y,cao j,song k,et al.fasttraffic:a lightweight method for encrypted traff
技术实现思路
1、本专利技术目的在于针对上述现有技术的缺陷和不足,提出了一种基于特征融合和分组空洞卷积网络的加密流量分类方法,该方法应用于高效的加密流量分类,针对隐私保护、高精度分类需求及高计算资源消耗问题进行了创新优化。
2、本专利技术解决其技术问题所采用的技术方案是:一种基于特征融合和分组空洞卷积网络的加密流量分类方法,该方法具体包括以下步骤:
3、步骤1:数据预处理;
4、需要对进行训练的流量原始数据做预处理,即包括流量切分、包过滤、数据标准化和截取需要的26字节的流量原始字节数据。
5、步骤2:联合特征提取;
6、对送入的预处理后的数据分别进行抽象与具象特征的提取,之后通过拼接得到流量的联合特征表示(涵盖了字节级别和包级别的特征)。
7、步骤3:神经网络分类输出;
8、将联合特征送入设计的神经网络中训练,神经网络根据联合特征的时空间的关系,设计了一个轻量化的学习率可变神经网络。
9、本专利技术的进一步改进在于,在步骤1中,数据预处理上的具体步骤如下。
10、步骤1-1:读取流量数据,按包粒度切分,过滤无效包,统一输入长度。
11、步骤1-2:将源和目标地址掩码为0.0.0.0,以保护隐私并避免因高频地址导致偏差。
12、步骤1-3:提取包头部的前36个字节,之后选取36个字节中的前10个字节和后16个字节,构成输入。
13、本专利技术的进一步改进在于,在步骤2中,联合特征提取的具体步骤如下。
14、步骤2-1:具象特征来源于每个字节的单独表示,主要通过滑动窗口为1的操作,将每个字节转为十进制数值,保留了数据的精细级别信息。这样的方法能够保留每个字节的独立信息,直接反映数据包中的精细结构,使模型可以学习到细粒度的特征,进而更好地描述流量包的独立特征。
15、步骤2-2:抽象特征通过滑动窗口为2的操作获取,以新设计的哈希函数和投影技术生成字节之间的关联表示。通过计算相邻字节的关系,这部分特征描述了字节间的上下文关联和空间结构,提取出流量数据中的时间和空间模式。
16、步骤2-3:将当前字节与前后字节的关联投射到高维空间中,从而创造出更加复杂、有意义的特征。这种映射方式使得低级信息和高级语义能够相互作用,帮助模型形成更丰富的特征表示。
17、步骤2-4:将嵌入后的具象特征和抽象特征相结合,生成一个综合的特征图,使模型能够同时捕捉低级的细节信息和高级的上下文关联。这其中,具象特征保留了数据的细节层次,而抽象特征则表征了更高层次的字节序列关系,通过这种融合增强了模型的表达能力。
18、本专利技术的进一步改进在于,在步骤3,神经网络分类输出步骤如下。
19、步骤3-1:将处理好的联合特征先分别输入2个并行的分组空洞卷积,2个分组空洞卷积的卷积核不同,提取不同范围的特征,相互补充,同时将输入通道划分为多个组,每个组内进行独立卷积。通过这种方式,降低了计算复杂度,同时提高了特征表达能力,最后将2个新特征组合。
20、步骤3-2:在分组空洞卷积操作之后引入通道洗牌,对特征图的通道维度进行调整,比如将通道分为多个组,再将每组的通道排列交换。经过洗牌后,不同组的通道被重新组合到一起,这使得同一通道上的信息来自不同的组,增强了通道间的信息共享与互补性。
21、步骤3-3:再通过逐点卷积来对通道进行混合和降维。逐点卷积采用1×1的卷积核,对每个通道进行逐像素的计算。它能够将各组卷积的结果混合,使得每个输出通道的信息来源于多个输入通道,这样的通道混合不仅可以加强通道间的信息交流,减少输出通道数,还能有效减少参数量,结合批归一化和leakyrelu激活函数,逐点卷积在保持高效的同时增强了模型的非线性表达能力。
22、步骤3-4:在卷积层输出的特征上,使用全连接层将其映射到各类流量类别,以生成最终的分类结果。通过softmax函数计算各类别的概率分布。交叉熵损失函数用于优化模型,最小化预测误差。在训练过程中,引入余弦本文档来自技高网...
【技术保护点】
1.一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述步骤1中,数据预处理包括:
3.根据权利要求1所述的一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述步骤2中,联合特征提取包括:
4.根据权利要求1所述的一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述步骤3中,神经网络分类输出包括:
5.根据权利要求1所述的一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述步骤3-4交叉熵损失函数能够帮助优化分类模型,使其预测更准确,并采用余弦退火机制控制学习率:
【技术特征摘要】
1.一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述步骤1中,数据预处理包括:
3.根据权利要求1所述的一种基于特征融合与分组空洞卷积网络的加密流量分类方法,其特征在于,所述步骤2中,联合特征...
【专利技术属性】
技术研发人员:蒋锐,王臣铖,王小明,徐友云,张子谦,韩晓云,邵瑞,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。