System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于深度学习的协议模糊测试优化方法技术_技高网

一种基于深度学习的协议模糊测试优化方法技术

技术编号:44383296 阅读:0 留言:0更新日期:2025-02-25 09:57
本发明专利技术涉及一种基于深度学习的协议模糊测试优化方法,属于网络技术领域。该方法包括:采集没有优化之前,Boofuzz在模糊测试过程中采集的数据,并按照服务器响应类型将具有不同响应的报文数据进行分类;通过协议逆向模块初步识别协议的动态字段、静态字段以及长度字段,并在Boofuzz框架中通过识别出的信息构造请求,设置会话消息;使用Boofuzz框架中的变异规则,根据协议逆向模块推断出的字段生成测试用例;构建优选器模型,初始化模型参数;通过SSA算法调整优化模型超参数,然后基于最优超参数进行模型训练;对生成的测试用例进行特征提取,获取输入特征;使用所述优选器模型对测试用例进行有效性预测。

【技术实现步骤摘要】

本专利技术属于网络,涉及一种基于深度学习的协议模糊测试优化方法。


技术介绍

1、在网络协议漏洞挖掘方法中,模糊测试是当前最常用、最有效的技术。工具如spike、peach和boofuzz等,都是基于此技术开发的。模糊测试的核心是向目标输入不同的测试用例,监测其响应以发现潜在漏洞,因此,测试用例的质量直接影响测试效果和效率。许多协议模糊测试工具,如boofuzz和peach,都要求用户定义协议格式。未定义协议格式的情况下,这些工具只能基于字节进行变异,但这种方式会产生许多无效变异,尤其在缺少上下文信息时,可能无法触发有效的漏洞。而逐字节变异特别耗费计算资源,容易生成大量冗余测试用例,这在处理复杂协议时尤为突出,且会导致测试路径爆炸。模糊测试还面临大量约束条件,这些条件来自协议字段的依赖、状态转换等复杂逻辑,增加了解决的难度和耗时。

2、综上,协议逆向工程在模糊测试工具中具有重要作用,它通过数据包分析提取协议结构和字段信息,有助于提高测试的准确性和有效性,特别是在处理复杂或闭源协议时。当前的序列比对算法多用于dna序列或文本字符串的比对,通常不考虑字符位置的偏差,这也是一个限制。

3、此外,人工智能技术在模糊测试中的主要作用是生成和筛选测试用例。通过遗传算法和神经网络,可自动过滤掉无效或低优先级的测试用例,提高测试效率和覆盖率。然而,当前模糊测试中的深度学习模型通常较简单,准确率有待提高。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种基于深度学习的协议模糊测试优化方法,解决模糊测试工具识别协议格式困难、测试用例产生路径爆炸以及约束求解复杂等问题。

2、为达到上述目的,本专利技术提供如下技术方案:

3、一种基于深度学习的协议模糊测试优化方法,该方法包括:

4、s1、采集没有优化之前,boofuzz在模糊测试过程中采集的数据,并按照服务器响应类型将具有不同响应的报文数据进行分类;

5、其中,报文数据的分类包括正常测试用例、无效测试用例和异常测试用例。正常测试用例为能够正常响应的测试用例;无效测试用例为无响应、未回复或响应消息通知格式错误的测试用例;异常测试用例为错误响应的测试用例;

6、s2、通过协议逆向模块初步识别协议的动态字段、静态字段以及长度字段,并在boofuzz框架中通过识别出的信息构造请求,设置会话消息;使用boofuzz框架中的变异规则,根据协议逆向模块推断出的字段生成测试用例;

7、s3、构建优选器模型,初始化模型参数;通过ssa算法调整优化模型超参数,然后基于最优超参数进行模型训练;

8、s4、对生成的测试用例进行特征提取,获取输入特征;使用所述优选器模型对测试用例进行有效性预测。

9、进一步的,步骤s2中,通过协议逆向模块初步识别协议的动态字段、静态字段以及长度字段包括:将报文按照长度递增的顺序排序,每次对相邻两个报文调用改进的smithwaterman算法提取格式串,直到只剩下一个字符串,得到协议静态字段;

10、随机选择几条报文,用提取出的格式串与它们进行匹配,并对格式串进行拆分,保留子字段较短的部分;

11、通过穷举法推断长度字段;

12、根据以上步骤获取其余类别报文的格式字段,以正常响应类别的报文为标准,分别用其他类别的报文数据进行序列比对,对比不同种类划分的字段,使得字段分割更加细腻。

13、其中,改进的smith waterman算法表示为:

14、

15、

16、式中,qij表示总得分,sij表示字节匹配得分,o表示空位罚分;p表示相对位置惩罚函数,distance表示两个不同字符之间的距离,lenth表示报文的总长度。

17、进一步的,步骤s3中,优选器模型为结合多种深度学习网络的模型,其中,深度学习网络包括卷积神经网络、双向长短期记忆网络、注意力机制和科尔莫哥罗夫-阿诺德网络。通过不同网络结构的组合,并且采用双通道的结构,同时结合cnn和lstm的优点,使得模型的准确率和收敛速度增快,该模型能够处理复杂的时序和空间特征数据并且比mlp使用到更少的参数。

18、进一步的,步骤s3中,通过ssa算法调整所述优选器模型的超参数,包括:

19、1)采集通信过程中不同响应类型的报文数据,并对数据进行清洗、格式化和归一化处理;

20、2)通过最小化损失函数来调整模型的权重,同时通过adam优化器根据损失值调整模型的参数,以提高模型的分类准确性;

21、3)采用ssa算法进行超参数寻优。

22、其中,所述的损失函数表示为:

23、

24、式中,n表示训练样本数量,c表示类别的数量;yic表示真实标签,表示样本i的真实类别,若样本i属于类别c,则yic=1,否则yic=0;oic表示模型预测的类别c的概率输出,即softmax层的输出。

25、第3)步中,采用ssa算法进行超参数寻优包括:

26、①初始化种群,生成一组随机解,其中每个解是一个超参数向量xi,表示每个个体的初始位置;

27、②通过模型训练与测试来评估每个解的表现,每个个体的适应度通过模型的误差率来评估:

28、

29、式中,m表示测试集样本数量,ym表示第m个样本的真实标签,om表示第m个样本的模型预测标签;ii(ym≠om)表示指示函数,当ym≠om时取1,表示预测错误;

30、③通过迭代更新最佳解,最终输出误差率最低的超参数组合;迭代过程中进行探索者更新、追随者更新和侦察预警操作,使追随者通过向当前最优解靠拢,以进行局部的开发和优化;迭代的结束条件为达到预设的最大迭代次数tmax或适应度变化不再显著。

31、本专利技术的有益效果在于:本专利技术通过在boofuzz框架的基础上增加协议逆向模块和优选器模块,其中协议逆向模块自动识别协议格式,然后通过识别的格式模板生成测试用例,优选器模块利用ssa-kan-cnn-bilstm-attention深度学习模型对测试用例的有效性进行预测,将预测为无效的测试用例剔除,优先选择可能发现漏洞的有效测试用例进行测试,提升测试用例的通过率以及漏洞挖掘的效率。本专利技术可解决协议识别困难、路径爆炸和复杂约束求解等问题,并且本专利技术适用于其他需要预先定义协议格式的模糊测试工具。

32、本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他优点可以通过下面的说明书来实现和获得。

本文档来自技高网...

【技术保护点】

1.一种基于深度学习的协议模糊测试优化方法,其特征在于,该方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过协议逆向模块初步识别协议的动态字段、静态字段以及长度字段包括:将报文按照长度递增的顺序排序,每次对相邻两个报文调用改进的Smith Waterman算法提取格式串,直到只剩下一个字符串,得到协议静态字段;

3.根据权利要求2所述的方法,其特征在于,所述改进的Smith Waterman算法表示为:

4.根据权利要求1所述的方法,其特征在于,所述优选器模型为结合多种深度学习网络的模型,其中,深度学习网络包括卷积神经网络、双向长短期记忆网络、注意力机制和科尔莫哥罗夫-阿诺德网络。

5.根据权利要求4所述的方法,其特征在于,通过SSA算法调整优化所述优选器模型的超参数,包括:

6.根据权利要求5所述的方法,其特征在于,所述损失函数表示为:

7.根据权利要求5所述的方法,其特征在于,所述采用SSA算法进行超参数寻优包括:

8.根据权利要求1所述的方法,其特征在于,所述报文数据的分类包括正常测试用例、无效测试用例和异常测试用例;所述正常测试用例为能够正常响应的测试用例;所述无效测试用例为无响应、未回复或响应消息通知格式错误的测试用例;所述异常测试用例为错误响应的测试用例。

...

【技术特征摘要】

1.一种基于深度学习的协议模糊测试优化方法,其特征在于,该方法包括:

2.根据权利要求1所述的方法,其特征在于,所述通过协议逆向模块初步识别协议的动态字段、静态字段以及长度字段包括:将报文按照长度递增的顺序排序,每次对相邻两个报文调用改进的smith waterman算法提取格式串,直到只剩下一个字符串,得到协议静态字段;

3.根据权利要求2所述的方法,其特征在于,所述改进的smith waterman算法表示为:

4.根据权利要求1所述的方法,其特征在于,所述优选器模型为结合多种深度学习网络的模型,其中,深度学习网络包括卷积神经网络、双向长短期记...

【专利技术属性】
技术研发人员:王浩陈俊廷魏旻韩延
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1