恶意样本增强方法、恶意程序检测方法及对应装置制造方法及图纸

技术编号：27976030 阅读：31 留言：0更新日期：2021-04-06 14:10

本申请涉及网络安全技术领域，提供一种恶意样本增强方法、恶意程序检测方法及对应装置。其中，恶意样本增强方法包括：获取原始恶意样本，该原始恶意样本为二进制文件；利用原始恶意样本训练生成对抗网络，该生成对抗网络包括判别器以及生成器；训练好后，利用生成器生成扩充恶意样本；将扩充恶意样本与原始恶意样本结合，形成增强的恶意样本集。该方法可基于少量的原始恶意样本派生出大量的扩充恶意样本，从而有利于增加样本集中恶意样本的数量，使得训练出来的恶意程序检测模型的泛化能力显著提高，进而对于多类恶意程序都能够有效地检测。并且，该方法中的扩充恶意样本由生成器自动生成，无需人工介入，因此是一种高效的样本增强方法。

全部详细技术资料下载

【技术实现步骤摘要】
恶意样本增强方法、恶意程序检测方法及对应装置
本专利技术涉及互联网
，具体而言，涉及一种恶意样本增强方法、恶意程序检测方法及对应装置。
技术介绍
在现有技术中，多采用深度学习模型对网络空间中的可执行威胁进行检测，然而，当训练深度学习模型所用的威胁数据集中样本数量较少时，训练出来的深度学习模型性能将大幅下降。目前，只能依赖人工去尽可能收集更多的样本，但此种做法不仅效率低下而且也不容易收集到所需的样本。
技术实现思路
本申请实施例的目的在于提供一种恶意样本增强方法及装置、存储介质及电子设备，以改善上述技术问题。为实现上述目的，本申请提供如下技术方案：第一方面，本申请实施例提供一种恶意样本增强方法，包括：获取原始恶意样本，所述原始恶意样本为二进制文件；利用所述原始恶意样本训练生成对抗网络，所述生成对抗网络包括判别器以及生成器；在所述生成对抗网络训练好后，利用所述生成器生成扩充恶意样本；将所述扩充恶意样本与所述原始恶意样本结合，形成增强的恶意样本集。上述方法利用生成对抗网络，可基于少量的原始恶意样本派生出大量的扩充恶意样本，从而有利于增加样本集中恶意样本的数量，在恶意样本的数量增多后，训练出来的恶意程序检测模型的泛化能力将显著提高，进而对于多类恶意程序都能够有效地检测。该方法中的扩充恶意样本是生成对抗网络的生成器自动生成的，无需人工介入，因此是一种高效的样本增强方法。此外，该方法还有利于改善样本不平衡问题、样本相似度问题以及模型过拟合问题，具体见后文阐述。需要指出，增...

【技术保护点】
1.一种恶意样本增强方法，其特征在于，包括：/n获取原始恶意样本，所述原始恶意样本为二进制文件；/n利用所述原始恶意样本训练生成对抗网络，所述生成对抗网络包括判别器以及生成器；/n在所述生成对抗网络训练好后，利用所述生成器生成扩充恶意样本；/n将所述扩充恶意样本与所述原始恶意样本结合，形成增强的恶意样本集。/n

【技术特征摘要】
1.一种恶意样本增强方法，其特征在于，包括：
获取原始恶意样本，所述原始恶意样本为二进制文件；
利用所述原始恶意样本训练生成对抗网络，所述生成对抗网络包括判别器以及生成器；
在所述生成对抗网络训练好后，利用所述生成器生成扩充恶意样本；
将所述扩充恶意样本与所述原始恶意样本结合，形成增强的恶意样本集。

2.根据权利要求1所述的恶意样本增强方法，其特征在于，所述获取原始恶意样本，包括：
通过以下至少一种方式获取所述原始恶意样本：
直接将具有恶意特征的二进制文件作为所述原始恶意样本；
对已有二进制文件进行反编译，对反编译生成的结果文件添加恶意特征或者改动其恶意特征后再将其编译为所述原始恶意样本；
将具有恶意代码的源文件编译后生成所述原始恶意样本。

3.根据权利要求1所述的恶意样本增强方法，其特征在于，所述生成对抗网络为序列生成对抗网络Seq-GAN，所述生成器为循环神经网络RNN，所述判别器为卷积神经网络CNN。

4.根据权利要求3所述的恶意样本增强方法，其特征在于，所述利用所述原始恶意样本训练生成对抗网络，包括：
随机初始化所述生成器和所述判别器的参数；
基于所述原始恶意样本，通过最大似然估计预训练所述生成器；
根据预训练的生成器生成初始数据，并基于所述初始数据通过最小化交叉熵预训练所述判别器；
在预训练完成后，迭代执行以下步骤进行对抗训练，直至所述生成对抗网络收敛：
将随机变量输入至所述生成器中以生成二进制文件序列；其中，所述二进制文件序列包括完整的二进制文件序列和非完整的二进制文件序列；
采用蒙特卡洛树搜索对所述非完整的二进制文件序列进行模拟，获得模拟的二进制文件序列；
将所述模拟的二进制文件序列与所述完整的二进制文件序列结合，形成新的二进制文件序列；
基于所述新的二进制文件序列和所述原始恶意样本训练所述判别器，并生成奖励值；
利用策略梯度算法结合所述奖励值训练所述生成器...

【专利技术属性】
技术研发人员：陈龙，王炜，江军，
申请(专利权)人：北京天融信网络安全技术有限公司，北京天融信科技有限公司，北京天融信软件有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人