【技术实现步骤摘要】
基于隐写的通用对抗扰动生成方法、介质及计算机设备
[0001]本专利技术属于深度学习安全
,尤其涉及一种基于隐写的通用对抗扰 动生成方法、介质及计算机设备。
技术介绍
[0002]目前,深度神经网络广泛应用于图像识别、智能语音识别、垃圾邮件过滤、 机器翻译、自动驾驶系统等领域。深度神经网络在各领域中发挥着巨大作用的 同时,其安全问题也逐渐暴露出来。大量研究发现,深度神经网络容易受到对 抗样本的影响,即它们很容易被人类不易察觉的扰动所愚弄,导致神经网络以 高置信度输出错误的预测。
[0003]现有的对抗扰动生成方法大都为每个样本生成特定的对抗性扰动,这种扰 动只适用于特定的样本,不能在样本间传递。此类对抗扰动生成方法时间代价 高,且在实际应用场景中难以部署。最新的研究表明,通用对抗扰动实现了扰 动的通用性,无需为每个样本生成特定的对抗扰动,在测试阶段也不需要获取 目标模型的信息即可执行攻击,其对神经网络的威胁更大。目前通用对抗扰动 生成方法有两个主要目标:(1)实现扰动的通用性,在测试阶段,将生成的通 用对抗扰动应用到与训练样本同一数据集的样本上能获得高的攻击成功率,在 不同数据集或者不同模型上该通用对抗扰动具有良好的迁移性;(2)实现扰动 的隐蔽性,生成的通用对抗扰动应该是人类难以察觉的。
[0004]现有的通用对抗扰动生成方法一般难以兼顾扰动的通用性与扰动的隐蔽 性,例如,申请公布号为CN111680292A,名称为“一种基于高隐蔽性通用扰动 的对抗样本生成方法”的专利技术专利申请,公开了一种
【技术保护点】
【技术特征摘要】
1.一种基于隐写的通用对抗扰动生成方法,其特征在于,所述基于隐写的通用对抗扰动生成方法,包括:步骤一,获取原始样本集、目标模型和隐写模型;步骤二,初始化掩码mask和模式pattern;步骤三,由mask和pattern计算扰动,并将扰动隐写到原始样本中得到对抗样本;步骤四,计算损失,优化mask和pattern;步骤五,epoch自增,若epoch小于总的迭代次数epochs,则执行步骤六,否者执行步骤七,其中epoch表示当前迭代次数,epoch的初始值为0,epochs≥500;步骤六,检查是否触发了早停机制,若满足早停条件,则执行步骤七,若不满足,重复步骤三
‑
步骤六,进行新一轮的迭代;步骤七,计算并保存最终的扰动。2.如权利要求1所述基于隐写的通用对抗扰动生成方法,其特征在于,所述步骤一中获取原始样本集、目标模型和隐写模型过程为:第一步,从含有M个类别的目标数据集中选取样本,为数据集中每一个类别随机选择N个不重复的样本,将选择的这些样本变换成相同尺寸W*H*C,组成规模为M
×
N的原始样本集X,将ImageNet数据集作为目标数据集,M=1000,N=10,W=224,H=224;第二步,获取预先训练好的目标模型的网络结构和权重,得到目标模型,将VGG16作为目标模型;第三步,获取预先训练好的隐写模型的网络结构和权重,得到隐写模型;隐写模型HNet(
·
),将原始样本与通用对抗扰动图像的数据格式都使用transpose()函数转化为[C,H,W]格式,C表示通道,H表示图像的高度,W表示图像的宽度;使用concat()函数在C所在维度上拼接原始图像和扰动图像,拼接后的图像作为该隐写模型的输入。3.如权利要求1所述基于隐写的通用对抗扰动生成方法,其特征在于,所述步骤二中初始化掩码mask和模式pattern过程为:a、使用random()函数随机生成与原始样本相同尺寸W*H的单通道掩码图像mask,并将mask中每一个元素的值限定在给定的上下界内;其中,上界MASK_MAX=1,下界MASK_MIN=0;b、使用random()函数随机生成与原始样本相同尺寸W*H的RGB模式图像pattern,并将pattern中每一个元素的值限定在给定的上下界内;其中,上界PATTERN_MAX=255,下界PATTERN_MIN=0。4.如权利要求1所述基于隐写的通用对抗扰动生成方法,其特征在于,所述步骤三中由mask和pattern计算扰动,并将扰动隐写到原始样本中得到对抗样本过程为:A、将mask与pattern对应位置元素相乘,表示为mask
⊙
pattern,得到扰动图像;B、使用预先训练好的隐写模型将通用对抗扰动隐写到原始样本中,获得对抗样本;隐写的实现方式为x
adv
=HNet(mask
⊙
pattern,x),即将原始样本x与通用对抗扰动mask
⊙
pattern按照步骤S101中的第三步进行拼接,将拼接后的图像送入到隐写模型进行隐写,将通用对抗扰动mask
⊙
pattern隐写到原始样本x中,得到隐写扰动后的对抗样本;C、按照步骤B的方式在样本集的每个样本上进行扰动隐写,即步骤B需要重复执行M
×
N次。
5.如权利要求1所述基于隐写的通用对抗扰动生成方法,其特征在于,所述步骤四中计算损失,优化mask和pattern过程为:1)、将一批添加了扰动的样本输入预先训练好的目标模型获得预测值,这批样本的数量为M
×
N,计算这批样本的平均攻击成功率acc;2)、计算原始样本和扰动样本的正则化损失loss_reg,采用L2正则化方法,再将loss_reg、目标模型对于扰动样本的预测值以及样本的真实标签代入无目标损失函数中,得到总的损失loss;3)、最小化损失loss,使用优化器优化mask和pattern,用adam优化器进行优化;4)、当同时满足acc<ε和loss_reg<reg_best两个条件时,令mask_best=mask、pattern_best=pattern、reg_best=loss_reg,其中ε为攻击阈值,要求0<ε≤1,reg_best为最好正则化的值,其初始值为无穷大,mask_best、patter...
【专利技术属性】
技术研发人员:高海昌,刘欢,王宇飞,高艺鹏,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。