当前位置: 首页 > 专利查询>四川大学专利>正文

一种深度开放的恶意软件家族识别模型构建方法技术

技术编号:38534017 阅读:14 留言:0更新日期:2023-08-19 17:05
本发明专利技术公开了一种深度开放的恶意软件家族识别模型构建方法,包括步骤:在t≥1时刻,基于已知恶意软件家族集合的训练样本和t

【技术实现步骤摘要】
一种深度开放的恶意软件家族识别模型构建方法


[0001]本专利技术涉及移动软件安全和深度学习领域,特别是一种深度开放的恶意软件家族识别模型构建方法。

技术介绍

[0002]鉴于恶意软件对移动生态的巨大威胁以及深度学习在构建安全应用方面的卓越成效,基于深度学习的恶意软件家族识别已引起移动安全社区的极大研究兴趣并成为近期的研究热点。当前,基于深度学习的方法已取得了最先进的识别性能,但它们构建于封闭假设之上(即假设恶意软件家族有限且都在训练阶段已学习),换言之,这类识别模型不知其所不知,会自信地将在推理阶段遇见的任何恶意软件都分类到已知家族(已知和未知家族分别指参与训练和未参与训练的恶意软件家族)。
[0003]然而,实际应用环境是开放和动态的,识别模型在部署后会不可避免地碰到无数未知家族。一方面,恶意软件作为攻击武器具有私有性,使得在模型部署之前获取所有现存家族进行训练几乎不可能。另一方面,该领域具有高度的对抗性,在模型部署之后会不断涌现出新家族。所以,当前基于封闭假设的识别方法在实际应用环境中会出现严重故障(即将来自未知家族的恶意软件全部误分到已知家族)。更糟糕的是,一旦这些误识别结果被用于指导安全威胁评估和防御计划制定,将对部署环境造成不可估量的危害。因此,需要打破封闭假设,研究具备检测和不断适应未知家族的能力的深度学习方案,本专利技术将其称为深度开放的恶意软件家族识别问题。
[0004]深度开放的恶意软件家族识别问题提出了两个关键任务:开放识别和增量更新。前者致力于赋予识别模型感知未知的能力,即使模型能够将来自未知家族的恶意软件检测为unknown而非分类到已知家族。后者力求以最小的代价将检测到的unknown纳入识别模型。然而,共同解决这两项任务并非易事,面临下述三个挑战:
[0005]·
学习偏好。将未知类别的实例识别为unknown需要很强的泛化能力。但用传统的深度学
[0006]习范式(例如,mini

batch SGD和交叉熵损失),识别模型仅针对已知家族进行优化,忽略开放环境设置。因此,识别模型严重过拟合已知类而无法推测未知类的潜在空间。换句话说,带有偏好的学习过程使得模型难以泛化以检测来自未知家族的恶意软件,从而降低了开放识别性能。
[0007]·
灾难性遗忘。从头开始训练模型是学习未知家族的最直接方法,但如此做需要保留所有以前的数据重新训练,过程非常耗时且存储成本高。更理想和自然的选择是用这些新类增量更新识别模型。然而,增量更新遭受灾难性遗忘,即在用新类别的实例微调模型时,会覆盖从旧类别学到的知识,导致旧类分类性能严重退化。
[0008]·
表征漂移。另外,测试和训练数据的家族标签空间的变化通常伴随着特征表示空间的变化,称为表征漂移。如果在整个增量更新过程中使用固定表示空间(即用旧类训练得到的表示空间),则表征漂移会导致新类别与其他类别(即旧类和未知类)之间的嵌入混
淆。在这种情况下,识别模型在新家族分类上会表现不佳。
[0009]因此,如何解决上述任务和挑战以实现开放环境下恶意软件家族识别是一个悬而未决的问题。

技术实现思路

[0010]本专利技术的目的是提供一种深度开放的恶意软件家族识别模型构建方法,以解决上述技术问题。
[0011]实现本专利技术目的的技术方案如下:
[0012]一种深度开放的恶意软件家族识别模型构建方法,包括步骤:
[0013]模型构建:在t≥1时刻,基于已知恶意软件家族集合的训练样本和t

1时刻的恶意软件家族识别模型训练表征网络和由多个二分类模型构成的分类器得到t时刻训练好的恶意软件家族识别模型其中,φ为表征网络参数,θ为分类器参数;其中,φ为表征网络参数,θ为分类器参数;是t

1时刻的已知家族集合,是t时刻待学习的新的已知家族集合;是t时刻待学习的新的已知家族集合;为随机初始化模型;
[0014]恶意软件家族识别:在t≥2时刻,将待识别恶意软件输入通过表征网络对其嵌入,再将其嵌入表示输入分类器的每个二分类器进行预测;如果每个二分类器都将该恶意软件检测为负例,将该恶意软件标记为未知类c0,由安全分析师进行家族打标,得到新的已知家族集合其中c
a+1
,...,c
a+b
为安全分析师从c0中发现的b个新家族;否则将该恶意软件分类到预测概率最高的分类器所对应的恶意软件家族c
j
中;其中,c1,

,c
a
为已知家族的类别;
[0015]若则执行模型构建步骤,进行增量更新。
[0016]进一步的技术方案,所述在t≥1时刻,基于已知恶意软件家族集合的训练样本和t

1时刻的恶意软件家族识别模型训练表征网络具体为:基于episodes的内、外层优化;其中,支持集S
i
和已知查询集由和的全部样本按3:1分层抽样得到,由的全部样本构成,
[0017]所述内层优化为:对于episode首先使用φ
t
‑1对其基网络参数φ

i
进行初始化,然后在S
i
上最小化成本函数优化φ

i

[0018][0019]式中,应用于S
i
中新家族样本的l1和l2分别是中心距离损失和交叉熵损失;应用于S
i
中旧家族范例的l3是蒸馏损失;x
m
是恶意软件样本,y
m
是x
m
的家族;
[0020][0021]其中,是在表征空间φ

i
下样本x
m
和质心之间的欧氏距离,为
家族y
m
中所有实例的平均值;是在表征空间φ

i
下样本x
m
和质心之间的欧氏距离;
[0022][0023]其中,是在表征空间φ

i
中使用softmax分类器将样本x
m
分类到家族的预测概率;如果则λ等于1,否则为0;
[0024][0025]所述外层优化为:通过在该批episodes上最小化下述成本函数更新表征网络参数φ
t
‑1:
[0026][0027][0028][0029]式中,是应用于的损失函数,是应用于的损失函数;
[0030]通过迭代执行上述两层优化,最终得到表征网络
[0031]所述训练由多个二分类模型构成的分类器具体为:
[0032]给定表征网络在已知家族集合的存储范例上训练分类器每个分类器是一个使用softmax激活函数的二分类器;为优化参数1≤n≤a+b,将属于家族c
n
的所有范例作为正样本,其余作为负样本,然后最小化下述成本函数
[0033][0034][0035]其中,M是的样本集本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度开放的恶意软件家族识别模型构建方法,其特征在于,包括步骤:模型构建:在t≥1时刻,基于已知恶意软件家族集合的训练样本和t

1时刻的恶意软件家族识别模型训练表征网络和由多个二分类模型构成的分类器得到t时刻训练好的恶意软件家族识别模型其中,φ为表征网络参数,θ为分类器参数;是t

1时刻的已知家族集合,是t时刻待学习的新的已知家族集合;为随机初始化模型;恶意软件家族识别:在t≥2时刻,将待识别恶意软件输入通过表征网络对其嵌入,再将其嵌入表示输入分类器的每个二分类器进行预测;如果每个二分类器都将该恶意软件检测为负例,将该恶意软件标记为未知类c0,由安全分析师进行家族打标,得到新的已知家族集合其中c
a+1
,

,c
a+b
为安全分析师从c0中发现的b个新家族;否则将该恶意软件分类到预测概率最高的分类器所对应的恶意软件家族c
j
中;其中,c1,

,c
a
为已知家族的类别;若则执行模型构建步骤,进行增量更新。2.如权利要求1所述的一种深度开放的恶意软件家族识别模型构建方法,其特征在于,所述在t≥1时刻,基于已知恶意软件家族集合的训练样本和t

1时刻的恶意软件家族识别模型训练表征网络具体为:基于episodes的内、外层优化;其中,支持集S
i
和已知查询集由和的全部样本按3:1分层抽样得到,由的全部样本构成,所述内层优化为:对于episode首先使用φ
t
‑1对其基网络参数φ

i
进行初始化,然后在S
i
上...

【专利技术属性】
技术研发人员:王俊峰鲁婷婷王继刚刘胜利
申请(专利权)人:四川大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1