【技术实现步骤摘要】
一种APT攻击数据的生成方法及相关装置
[0001]本申请涉及网络信息安全领域,尤其涉及一种APT攻击数据的生成方法及相关装置。
技术介绍
[0002]高级持续性威胁(Advanced Persistent Threat,APT),是由某些组织精心设计策划,向特定目标发起的隐匿而持久的网络攻击,因此,APT通常具有隐藏性、长期持续性、威胁等特征。
[0003]进一步地,由于APT的攻击具有隐藏性,善于在攻击过程中伪装,从而不容易被发现,并且,在完成数据窃取以后,会删除记录踪迹的日志,很难溯源,所以在通常的威胁检测中,APT攻击样本数量极少,难以满足基于机器学习或者深度学习的模型检测的样本数据需求。
[0004]相关技术中,参阅图1所示,通常采用生成对抗网络(Generative Adversarial Network,GAN),生成或扩充样本数据集,从而获得以假乱真的合成数据;其中,生成器G用于接收随机噪声,并生成接近真实数据分布的合成数据,判别器D用于接受真实数据和合成数据,并准确分类真/假数据。
[0005]然而,采用上述的样本数据生成方式,会因GAN无法捕获序列的时间依赖性,从而导致难以合成复杂时间序列数据(如,APT攻击数据)。
[0006]因此,如何解决目前作为样本的APT攻击数据较少,无法满足APT攻击检测的APT攻击数据样本需求,是目前亟需解决的问题。
技术实现思路
[0007]本申请实施例提供了一种APT攻击数据的生成方法及相关装置,用以解决目前作为样本 ...
【技术保护点】
【技术特征摘要】
1.一种高级持续性威胁APT攻击数据的生成方法,其特征在于,包括:从终端日志的拦截结果中,获取原始APT攻击数据,并基于所述原始APT攻击数据及其关联的网络地址信息,生成初始链路攻击数据;其中,所述网络地址信息至少包括一组源网际互连协议IP和目标IP;将所述初始链路攻击数据的数据特征集,输入预设的APT攻击数据生成模型,获取所述APT攻击数据生成模型输出的目标链路攻击数据;其中,所述数据特征集包含的各个数据特征表征:相应数据链路的请求信息,所述APT攻击数据生成模型是基于最小二乘损失函数拟合训练得到的;按照设定的APT数据格式,对所述目标链路攻击数据进行数据格式转换,获得相应的目标APT攻击数据。2.如权利要求1所述的方法,其特征在于,所述基于所述原始APT攻击数据及其关联的网络地址信息,生成初始链路攻击数据,包括:从所述终端日志中,获取所述原始APT攻击数据的数据标识关联的网络地址信息;基于所述网络地址信息包含的网络特征和网络属性,以及所述原始APT攻击数据,生成所述初始链路攻击数据。3.如权利要求1或2所述的方法,其特征在于,所述APT攻击数据生成模型是采用如下方式训练的:基于所述多个样本APT攻击数据,分别执行以下操作:对第一样本APT攻击数据对应的样本链路攻击数据进行特征提取,获得所述样本链路攻击数据的数据特征集;其中,所述第一样本APT攻击数据为所述多个样本APT攻击数据中的任意一个;基于所述样本链路攻击数据的数据特征集,以及所述最小二乘损失函数,对所述APT攻击数据生成模型进行多次迭代训练,直至所述APT攻击数据生成模型满足预设的APT攻击数据生成条件为止。4.如权利要求3所述的方法,其特征在于,所述基于所述样本链路攻击数据的数据特征集,以及所述最小二乘损失函数,对所述APT攻击数据生成模型进行多次迭代训练,包括:在一次迭代训练的过程中,执行以下操作:将所述样本链路攻击数据的数据特征集输入所述APT攻击数据生成模型,获取所述APT攻击数据生成模型输出的合成链路攻击数据;基于所述最小二乘损失函数,获得所述样本链路攻击数据与所述合成链路攻击数据之间的损失值;其中,所述损失值表征:所述样本链路攻击数据与所述合成链路攻击数据的数据相似度;基于获得的损失值,对所述APT攻击数据生成模型的模型参数进行调整。5.如权利要求3所述的方法,其特征在于,若满足以下条件,则确定所述APT攻击数据生成模型满足预设的APT攻击数据生成条件:获取所述样本链路攻击数据中,各个数据链路各自的链路持续时长;其中,每个数据链路是由一组源IP和目标IP构成的,每个链路持续时长表征:所述样本链路攻击数据通过相应数据链路进行持续攻击的时间;对所述各个数据链路各自的链路持续时长进行整理,获得所述样本链路攻击数据的测
试数据链路持续时长分布;若所述测试数据链路持续时长分布,与所述第一样本APT攻击数据对应的预期数据链路持续时长分布,符合预设的链路持续时长分布相似性要求,则确定所述APT攻击数据生成模型满足所述APT攻击数据生成条件。6.一种APT攻击数据的生成装置,其特征在于,包括:获取模块,用于从终端日志的拦截结果中,获取原始APT攻击数据,并基于所述原始APT攻击数据及其关联的网络地址信息,生成初始链路攻击数据;其中,所述网络地址信息至少...
【专利技术属性】
技术研发人员:王彦婷,徐玉清,蔡锋,钟良志,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。