一种深度开放的恶意软件家族识别模型构建方法技术

技术编号：38534017 阅读：14 留言：0更新日期：2023-08-19 17:05

本发明专利技术公开了一种深度开放的恶意软件家族识别模型构建方法，包括步骤：在t≥1时刻，基于已知恶意软件家族集合的训练样本和t

全部详细技术资料下载

【技术实现步骤摘要】
一种深度开放的恶意软件家族识别模型构建方法

[0001]本专利技术涉及移动软件安全和深度学习领域，特别是一种深度开放的恶意软件家族识别模型构建方法。

技术介绍

[0002]鉴于恶意软件对移动生态的巨大威胁以及深度学习在构建安全应用方面的卓越成效，基于深度学习的恶意软件家族识别已引起移动安全社区的极大研究兴趣并成为近期的研究热点。当前，基于深度学习的方法已取得了最先进的识别性能，但它们构建于封闭假设之上(即假设恶意软件家族有限且都在训练阶段已学习)，换言之，这类识别模型不知其所不知，会自信地将在推理阶段遇见的任何恶意软件都分类到已知家族(已知和未知家族分别指参与训练和未参与训练的恶意软件家族)。
[0003]然而，实际应用环境是开放和动态的，识别模型在部署后会不可避免地碰到无数未知家族。一方面，恶意软件作为攻击武器具有私有性，使得在模型部署之前获取所有现存家族进行训练几乎不可能。另一方面，该领域具有高度的对抗性，在模型部署之后会不断涌现出新家族。所以，当前基于封闭假设的识别方法在实际应用环境中会出现严重故障(即将来自未知家族的恶意软件全部误分到已知家族)。更糟糕的是，一旦这些误识别结果被用于指导安全威胁评估和防御计划制定，将对部署环境造成不可估量的危害。因此，需要打破封闭假设，研究具备检测和不断适应未知家族的能力的深度学习方案，本专利技术将其称为深度开放的恶意软件家族识别问题。
[0004]深度开放的恶意软件家族识别问题提出了两个关键任务：开放识别和增量更新。前者致力于赋予识别模型感知未知的能力，即使模...

【技术保护点】

【技术特征摘要】
1.一种深度开放的恶意软件家族识别模型构建方法，其特征在于，包括步骤：模型构建：在t≥1时刻，基于已知恶意软件家族集合的训练样本和t
‑
1时刻的恶意软件家族识别模型训练表征网络和由多个二分类模型构成的分类器得到t时刻训练好的恶意软件家族识别模型其中，φ为表征网络参数，θ为分类器参数；是t
‑
1时刻的已知家族集合，是t时刻待学习的新的已知家族集合；为随机初始化模型；恶意软件家族识别：在t≥2时刻，将待识别恶意软件输入通过表征网络对其嵌入，再将其嵌入表示输入分类器的每个二分类器进行预测；如果每个二分类器都将该恶意软件检测为负例，将该恶意软件标记为未知类c0，由安全分析师进行家族打标，得到新的已知家族集合其中c
a+1
,
…
,c
a+b
为安全分析师从c0中发现的b个新家族；否则将该恶意软件分类到预测概率最高的分类器所对应的恶意软件家族c
j
中；其中，c1,
…
,c
a
为已知家族的类别；若则执行模型构建步骤，进行增量更新。2.如权利要求1所述的一种深度开放的恶意软件家族识别模型构建方法，其特征在于，所述在t≥1时刻，基于已知恶意软件家族集合的训练样本和t
‑
1时刻的恶意软件家族识别模型训练表征网络具体为：基于episodes的内、外层优化；其中，支持集S
i
和已知查询集由和的全部样本按3:1分层抽样得到，由的全部样本构成，所述内层优化为：对于episode首先使用φ
t
‑1对其基网络参数φ
′
i
进行初始化，然后在S
i
上...

【专利技术属性】
技术研发人员：王俊峰，鲁婷婷，王继刚，刘胜利，
申请(专利权)人：四川大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人