基于扩散处理的洁净对抗训练、对抗样本生成方法及设备技术

技术编号：44006455 阅读：22 留言：0更新日期：2025-01-10 20:24

本申请实施例提供了一种基于扩散处理的洁净对抗训练、对抗样本生成方法及设备，涉及人工智能技术领域，上述洁净对抗样本生成方法包括：对原始样本和第一噪声进行扩散处理，得到第一带噪样本；使用待训练模型处理原始样本，得到第一结果；使用待训练模型处理第一带噪样本，得到第二结果；基于第一结果和第二结果，获得第一带噪样本相对于原始样本的噪声散度；基于噪声散度和第一带噪样本，生成第二噪声，对第一带噪样本和第二噪声进行叠加，得到第二带噪样本；对第二带噪样本进行逆扩散处理，从第二带噪样本去除分离噪声；基于噪声去除结果，获得对抗样本。应用本申请实施例提供的方案，能够生成对抗训练的过程中需要使用的对抗样本。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，特别是涉及一种基于扩散处理的洁净对抗训练、对抗样本生成方法及设备。

技术介绍

1、在使用训练得到的神经网络模型进行数据处理时，模型可能会遭受攻击，从而产生错误输出。以图像分类模型为例，待输入模型的图像可能会被攻击者进行人眼难以察觉的篡改，篡改后的图像可以称为对抗样本，这样，将对抗样本输入模型后，模型针对对抗样本产生的输出可能与针对原始的图像产生的输出不同，也即模型产生了错误的输出。

2、相关技术中，可以通过对抗训练来降低模型产生错误输出的概率。对抗训练的原理是：在模型训练阶段，生成易使得模型产生错误输出的对抗样本，然后，采用对抗样本对模型进行训练，以提高训练得到的模型针对对抗样本的抵御能力，也即降低模型针对对抗样本产生错误输出的概率，提高模型的鲁棒性。

3、鉴于上述情况，需要提供一种对抗样本生成方案，以生成对抗训练的过程中需要使用的对抗样本。

技术实现思路

1、本申请实施例的目的在于提供一种基于扩散处理的洁净对抗训练、对抗样本生成方法及设备，以生成对抗训练的过程中需要使用的对抗样本。具体技术方案如下：

2、第一方面，本申请实施例提供了一种基于扩散处理的洁净对抗样本生成方法，所述方法包括：

3、对原始样本和第一噪声进行扩散处理，得到第一带噪样本；

4、使用待训练模型对所述原始样本进行数据处理，得到第一处理结果；

5、使用所述待训练模型对所述第一带噪样本进行数据处理，得到第二处理结果；

<...

【技术保护点】

1.一种基于扩散处理的洁净对抗样本生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于噪声去除结果，获得对抗样本，包括：

3.根据权利要求2所述的方法，其特征在于，所述迭代结束条件包括以下条件中的至少一种：

4.根据权利要求2所述的方法，其特征在于，所述从所述第二带噪样本去除所述分离噪声，包括：

5.根据权利要求1所述的方法，其特征在于，所述第一处理结果包括：所述待训练模型预测得到的所述原始样本属于各个设定类别的第一置信度，所述第二处理结果包括：所述待训练模型预测得到的所述第一带噪样本属于各个设定类别的第二置信度，

6.根据权利要求5所述的方法，其特征在于，所述基于所得置信度差异，确定所述第一带噪样本相对于所述原始样本的噪声散度，包括：

7.根据权利要求1所述的方法，其特征在于，

8.一种基于扩散处理的洁净对抗训练方法，其特征在于，所述方法包括：

9.一种电子设备，其特征在于，包括：

10.一种计算机程序产品，包括计算机程序，其特征在于，

...

【技术特征摘要】

1.一种基于扩散处理的洁净对抗样本生成方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于噪声去除结果，获得对抗样本，包括：

3.根据权利要求2所述的方法，其特征在于，所述迭代结束条件包括以下条件中的至少一种：

4.根据权利要求2所述的方法，其特征在于，所述从所述第二带噪样本去除所述分离噪声，包括：

5.根据权利要求1所述的方法，其特征在于，所述第一处理结果包括：所述待训练模型预测得到的所述原始样本属于各个设定类别的第一置信度，所述第二处理结果包...

【专利技术属性】
技术研发人员：王滨，钱亚冠，王星，
申请(专利权)人：杭州海康威视数字技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人