对抗扰动生成方法、装置及存储介质制造方法及图纸

技术编号：32969284 阅读：22 留言：0更新日期：2022-04-09 11:31

本申请实施例涉及计算机视觉领域，一些实施例提供了一种对抗扰动生成方法、装置及存储介质。该方法包括：获取原始图像、第一图像识别模型和对抗扰动；将所述原始图像与所述对抗扰动叠加后，输入所述第一图像识别模型，得到输出结果；计算所述输出结果与攻击目标标签之间的相似度；若所述输出结果与攻击目标标签之间的相似度未达到第一预设阈值，则更新所述对抗扰动，直至所述输出结果与攻击目标标签之间的相似度达到第一预设阈值，并将更新后的对抗扰动作为目标对抗扰动。本申请实施例可以基于知识蒸馏得到的代理模型生成对抗图像，由于知识蒸馏时，代理模型学习到了更加全面的特征，从而生成的对抗图像能够迁移攻击多更多不同的图像识别模型。图像识别模型。图像识别模型。

全部详细技术资料下载

【技术实现步骤摘要】
对抗扰动生成方法、装置及存储介质

[0001]本申请实施例涉及计算机视觉领域，更具体地涉及一种对抗扰动生成方法、装置及存储介质。

技术介绍

[0002]在实际分类任务中，待识别的图像不可避免地存在一些包含干扰的对象，如果需要通过图像识别模型对该包含干扰的图象准确进行分类，则需要图像识别模型具有较高的抗干扰能力。相关技术中，一般通过对抗图像来对待检测的图像识别模型(例如商业模型)的抗干扰能力进行检测。通常采用基于询问的方法和基于迁移的方法来生成对抗图像。
[0003]由于基于询问的方法需要多次访问待检测的图像识别模型，而商用模型(例如手机或门禁的人脸识别模型)一般都是黑盒模型，且通常都会设置限制访问策略。由此，很难通过基于询问的方法生成针对商用模型的对抗图像。对于商用模型，通常采用基于迁移的方法生成用于检测商业模型的抗干扰能力的对抗图像。
[0004]基于迁移的方法需要在与商用模型具有相同识别特性的代理模型上生成对抗图像，即需要预先获取受害模型，才能在该受害模型生成对抗图像，然后利用该对抗图像对商用模型进行迁移攻击，以确定待检测的商用模型的抗干扰能力。
[0005]然而，现有的基于迁移的方法，往往需要针对每个待检测模型，都对应的选取一个代理模型来生成对抗图像，生成的对抗图像只能对有限数量的图像识别模型成功地迁移攻击，可见，基于该方法生成的对抗图像的迁移攻击性能较弱，即基于与待检测模型不匹配的代理模型生成的对抗图像，影响对待检测模型的抗干扰能力的检测效果，甚至无法检测抗干扰能力。
专利技术...

【技术保护点】

【技术特征摘要】
1.一种对抗扰动生成方法，包括：获取原始图像、第一图像识别模型和对抗扰动，其中，所述第一图像识别模型通过知识蒸馏得到，在进行知识蒸馏时，仅通过第二图像识别模型的预测概率分布指导所述第一图像识别模型的训练；将所述原始图像与所述对抗扰动叠加后，输入所述第一图像识别模型，得到输出结果；计算所述输出结果与攻击目标标签之间的相似度；若所述输出结果与攻击目标标签之间的相似度未达到第一预设阈值，则更新所述对抗扰动，直至所述第一图像识别模型的输出结果与攻击目标标签之间的相似度达到第一预设阈值，并将更新后的对抗扰动作为目标对抗扰动；其中，所述目标对抗扰动用于叠加所述原始图像，生成对抗图像，所述对抗图像用于迁移攻击多个与所述第一图像识别模型不同的图像识别模型。2.如权利要求1所述的对抗扰动生成方法，其中，所述第一图像识别模型通过以下步骤迭代地进行知识蒸馏得到，包括：获取待训练的第一图像识别模型、第二图像识别模型和第一图像样本；将所述第一图像样本输入所述第二图像识别模型，得到所述第二图像识别模型基于所述第一图像样本输出的第一预测概率分布；将所述第一图像样本输入所述第一图像识别模型，得到所述第一图像识别模型基于所述第一图像样本输出的第二预测概率分布；计算所述第二预测概率分布与所述第一预测概率分布的相似度；若所述第二预测概率分布与所述第一预测概率分布的相似度小于第二预设阈值，则更新所述第一图像识别模型的参数，直至所述第二预测概率分布与所述第一预测概率分布的相似度大于第二预设阈值，并将更新后的第一图像识别模型作为知识蒸馏得到的第一图像识别模型。3.如权利要求2所述的对抗扰动生成方法，其中，所述第二图像识别模型通过以下方式训练得到：获取第二图像样本集以及所述第二图像样本集中各个第二图像样本对应的标签；采用所述第二图像样本集迭代优化所述第二图像识别模型，直到达到第一预设终止条件，在每个迭代轮次：获取一个第二图像样本输入所述第二图像识别模型，得到对应的输出结果；将所述第二图像样本的标签转换为独热编码向量，所述独热编码向量包括预设数量的维度，所述预设数量为所述第二图像样本集中的标签空间中的标签数量，所述标签空间为所述第二图像样本集中各个图像的标签的集合，且不存在重复的标签；计算所述独热编码向量与所述输出结果之间的相似度；更新所述第二图像识别模型的参数，以使所述独热编码向量与所述输出结果之间的相似度变大；其中，所述第一预设终止条件至少包括以下中的一个：遍历第二图像样本集、迭代预设轮次和所述第二图...

【专利技术属性】
技术研发人员：ꢀ七四专利代理机构，
申请(专利权)人：北京瑞莱智慧科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人