恶意样本增强方法、恶意程序检测方法及对应装置制造方法及图纸

技术编号:27976030 阅读:18 留言:0更新日期:2021-04-06 14:10
本申请涉及网络安全技术领域,提供一种恶意样本增强方法、恶意程序检测方法及对应装置。其中,恶意样本增强方法包括:获取原始恶意样本,该原始恶意样本为二进制文件;利用原始恶意样本训练生成对抗网络,该生成对抗网络包括判别器以及生成器;训练好后,利用生成器生成扩充恶意样本;将扩充恶意样本与原始恶意样本结合,形成增强的恶意样本集。该方法可基于少量的原始恶意样本派生出大量的扩充恶意样本,从而有利于增加样本集中恶意样本的数量,使得训练出来的恶意程序检测模型的泛化能力显著提高,进而对于多类恶意程序都能够有效地检测。并且,该方法中的扩充恶意样本由生成器自动生成,无需人工介入,因此是一种高效的样本增强方法。

【技术实现步骤摘要】
恶意样本增强方法、恶意程序检测方法及对应装置
本专利技术涉及互联网
,具体而言,涉及一种恶意样本增强方法、恶意程序检测方法及对应装置。
技术介绍
在现有技术中,多采用深度学习模型对网络空间中的可执行威胁进行检测,然而,当训练深度学习模型所用的威胁数据集中样本数量较少时,训练出来的深度学习模型性能将大幅下降。目前,只能依赖人工去尽可能收集更多的样本,但此种做法不仅效率低下而且也不容易收集到所需的样本。
技术实现思路
本申请实施例的目的在于提供一种恶意样本增强方法及装置、存储介质及电子设备,以改善上述技术问题。为实现上述目的,本申请提供如下技术方案:第一方面,本申请实施例提供一种恶意样本增强方法,包括:获取原始恶意样本,所述原始恶意样本为二进制文件;利用所述原始恶意样本训练生成对抗网络,所述生成对抗网络包括判别器以及生成器;在所述生成对抗网络训练好后,利用所述生成器生成扩充恶意样本;将所述扩充恶意样本与所述原始恶意样本结合,形成增强的恶意样本集。上述方法利用生成对抗网络,可基于少量的原始恶意样本派生出大量的扩充恶意样本,从而有利于增加样本集中恶意样本的数量,在恶意样本的数量增多后,训练出来的恶意程序检测模型的泛化能力将显著提高,进而对于多类恶意程序都能够有效地检测。该方法中的扩充恶意样本是生成对抗网络的生成器自动生成的,无需人工介入,因此是一种高效的样本增强方法。此外,该方法还有利于改善样本不平衡问题、样本相似度问题以及模型过拟合问题,具体见后文阐述。需要指出,增强的恶意样本集虽然可用于训练恶意程序检测模型,但并不必然用于训练该模型,即该方法并没有限定最终得到的恶意样本集的用途。在第一方面的一种实现方式中,所述获取原始恶意样本,包括:通过以下至少一种方式获取所述原始恶意样本:直接将具有恶意特征的二进制文件作为所述原始恶意样本;对已有二进制文件进行反编译,对反编译生成的结果文件添加恶意特征或者改动其恶意特征后再将其编译为所述原始恶意样本;将具有恶意代码的源文件编译后生成所述原始恶意样本。原始恶意样本有多种可能的获取方式,其获取渠道是广泛的、灵活的。上述第一种方式代表收集到的样本本就是二进制文件,因此无需进行转换即可将其作为原始恶意样本,例如恶意文件本就是可执行文件的情况。上述第二种方式代表开发人员希望对已有的二进制文件进行一定程度的改动的情况(例如,添加恶意特征或者修改其本身的恶意特征),由于开发人员无法直接修改二进制内容,因此需要先将其反编译为可读的结果文件再行修改。上述第三种方式代表恶意文件是源文件的情况,需要对其进行编译,才能得到相应的二进制文件并将其作为原始恶意样本,例如,开发人员自己编写的恶意程序。在第一方面的一种实现方式中,所述生成对抗网络为序列生成对抗网络Seq-GAN,所述生成器为循环神经网络RNN,所述判别器为卷积神经网络CNN。二进制文件可视为一种离散型数据,因此可采用原始GAN网络的变形,即Seq-GAN进行处理,Seq-GAN借鉴了强化学习的策略,有效解决了原始GAN应用于离散数据的问题。在第一方面的一种实现方式中,所述利用所述原始恶意样本训练生成对抗网络,包括:随机初始化所述生成器和所述判别器的参数;基于所述原始恶意样本,通过最大似然估计预训练所述生成器;根据预训练的生成器生成初始数据,并基于所述初始数据通过最小化交叉熵预训练所述判别器;在预训练完成后,迭代执行以下步骤进行对抗训练,直至所述生成对抗网络收敛:将随机变量输入至所述生成器中以生成二进制文件序列;其中,所述二进制文件序列包括完整的二进制文件序列和非完整的二进制文件序列;采用蒙特卡洛树搜索对所述非完整的二进制文件序列进行模拟,获得模拟的二进制文件序列;将所述模拟的二进制文件序列与所述完整的二进制文件序列结合,形成新的二进制文件序列;基于所述新的二进制文件序列和所述原始恶意样本训练所述判别器,并生成奖励值;利用策略梯度算法结合所述奖励值训练所述生成器。上述实现方式给出了本申请中Seq-GAN的一种可能的训练方法,大致可分为两个阶段:第一阶段为预训练阶段,输出预训练好的生成器与判别器;第二阶段为正式训练阶段,基于GAN的生成对抗原理,并结合强化学习策略,继续训练第一阶段得到的生成器与判别器,直至模型收敛。在第一方面的一种实现方式中,在所述利用所述生成对抗网络中的生成网络生成扩充恶意样本之后,以及在所述将所述扩充恶意样本与所述原始恶意样本结合,形成增强的恶意样本集之前,所述方法还包括:检测所述扩充恶意样本的可执行性以及恶意性。对于生成的扩充恶意样本,可以检测其有效性,例如可否执行、是否具有恶意特征等。若检测通过,表明生成器是有效的,可以进一步使用该生成器生成样本,否则可能需要重新训练生成对抗网络。第二方面,本申请实施例提供一种恶意程序检测方法,包括:基于第一方面或第一方面的任意一种可能的实现方式提供的方法构建增强的恶意样本集;利用所述增强的恶意样本集训练恶意程序检测模型,所述恶意程序检测模型为神经网络模型;将训练好的恶意程序检测模型导出至检测器,并利用所述检测器检测程序样本。上述方法由于使用了本申请实施例提供的恶意样本增强方法来获得增强的恶意样本集,因此该恶意样本集包含较多的恶意样本,从而训练出来的恶意程序检测模型的泛化能力将显著提高,进而所导出的检测器对于多类恶意程序都能够有效地检测。此外,该方法还有利于改善样本不平衡问题、样本相似度问题以及模型过拟合问题,具体见后文阐述。第三方面,本申请实施例提供一种恶意样本增强装置,包括:样本获取模块,用于获取原始恶意样本,所述原始恶意样本为二进制文件;第一模型训练模块,用于利用所述原始恶意样本训练生成对抗网络,所述生成对抗网络包括判别器以及生成器;样本生成模块,用于在所述生成对抗网络训练好后,利用所述生成器生成扩充恶意样本;样本增强模块,用于将所述扩充恶意样本与所述原始恶意样本结合,形成增强的恶意样本集。第四方面,本申请实施例提供一种恶意程序检测装置,包括:样本集构建模块,用于基于第一方面或第一方面的任意一种可能的实现方式提供的方法构建增强的恶意样本集;第二模型训练模块,用于利用所述增强的恶意样本集训练恶意程序检测模型,所述恶意程序检测模型为神经网络模型;检测模块,用于将训练好的恶意程序检测模型导出至检测器,并利用所述检测器检测程序样本。第五方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令,所述计算机程序指令被处理器读取并运行时,执行第一方面、第二方面或这两方面的任意一种可能的实现方式提供的方法。第六方面,本申请实施例提供一种电子设备,包括:存储器以及处理器,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器读取并运行时,执行第一方面、第二方面或这两方面的任意一种可能的实现方式提供的方法。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理本文档来自技高网...

【技术保护点】
1.一种恶意样本增强方法,其特征在于,包括:/n获取原始恶意样本,所述原始恶意样本为二进制文件;/n利用所述原始恶意样本训练生成对抗网络,所述生成对抗网络包括判别器以及生成器;/n在所述生成对抗网络训练好后,利用所述生成器生成扩充恶意样本;/n将所述扩充恶意样本与所述原始恶意样本结合,形成增强的恶意样本集。/n

【技术特征摘要】
1.一种恶意样本增强方法,其特征在于,包括:
获取原始恶意样本,所述原始恶意样本为二进制文件;
利用所述原始恶意样本训练生成对抗网络,所述生成对抗网络包括判别器以及生成器;
在所述生成对抗网络训练好后,利用所述生成器生成扩充恶意样本;
将所述扩充恶意样本与所述原始恶意样本结合,形成增强的恶意样本集。


2.根据权利要求1所述的恶意样本增强方法,其特征在于,所述获取原始恶意样本,包括:
通过以下至少一种方式获取所述原始恶意样本:
直接将具有恶意特征的二进制文件作为所述原始恶意样本;
对已有二进制文件进行反编译,对反编译生成的结果文件添加恶意特征或者改动其恶意特征后再将其编译为所述原始恶意样本;
将具有恶意代码的源文件编译后生成所述原始恶意样本。


3.根据权利要求1所述的恶意样本增强方法,其特征在于,所述生成对抗网络为序列生成对抗网络Seq-GAN,所述生成器为循环神经网络RNN,所述判别器为卷积神经网络CNN。


4.根据权利要求3所述的恶意样本增强方法,其特征在于,所述利用所述原始恶意样本训练生成对抗网络,包括:
随机初始化所述生成器和所述判别器的参数;
基于所述原始恶意样本,通过最大似然估计预训练所述生成器;
根据预训练的生成器生成初始数据,并基于所述初始数据通过最小化交叉熵预训练所述判别器;
在预训练完成后,迭代执行以下步骤进行对抗训练,直至所述生成对抗网络收敛:
将随机变量输入至所述生成器中以生成二进制文件序列;其中,所述二进制文件序列包括完整的二进制文件序列和非完整的二进制文件序列;
采用蒙特卡洛树搜索对所述非完整的二进制文件序列进行模拟,获得模拟的二进制文件序列;
将所述模拟的二进制文件序列与所述完整的二进制文件序列结合,形成新的二进制文件序列;
基于所述新的二进制文件序列和所述原始恶意样本训练所述判别器,并生成奖励值;
利用策略梯度算法结合所述奖励值训练所述生成器...

【专利技术属性】
技术研发人员:陈龙王炜江军
申请(专利权)人:北京天融信网络安全技术有限公司北京天融信科技有限公司北京天融信软件有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1