一种数据投毒攻击方法、电子设备、存储介质和系统技术方案

技术编号：33969012 阅读：10 留言：0更新日期：2022-06-30 02:01

本公开涉及一种数据投毒攻击方法、电子设备、存储介质和系统，所述方法包括如下步骤:建立目标模型；获取目标模型中权重参数w的梯度；计算梯度数据分布方差最小的方向作为投毒攻击模型修改的方向进行训练；使用训练后的投毒攻击模型生成投毒样本。和其他的随机选择模型修改方向的投毒样本生成方法相比，本公开通过将梯度方差最小的方向作为模型修改方向，在达到和其他投毒攻击方法相同攻击效果的前提下，投毒样本比其他投毒方案中的投毒样本产生更小的梯度，而更小的梯度具有对梯度裁剪操作的鲁棒性。剪操作的鲁棒性。剪操作的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据投毒攻击方法、电子设备、存储介质和系统

[0001]本公开涉及数据安全领域，具体涉及一种数据投毒攻击方法、电子设备、存储介质和系统。

技术介绍

[0002]数据投毒攻击的目的是通过恶意修改训练集来操纵学习算法生成的模型，训练完成的模型会按照攻击者的需求产生预测结果。数据投毒的基本方法是在某个具体的训练样本（x，y）上添加扰动生成投毒样本（xp,yp），然后将投毒样本混入模型的训练数据集中，使用投毒后的训练集训练得到的模型，其预测结果会根据攻击者的意愿发生改变。
[0003]现有技术中如专利CN112182576A公开了一种基于深度学习中特征碰撞的投毒攻击方法，该方法通过重复获取神经网络中输入层的弗罗贝尼乌斯距离来产生针对某个具体神经网络模型的投毒数据。该方案的专利技术目的在于通过在制作投毒样本的过程中添加投毒样本对数据扩增的适应性训练，可使投毒攻击在数据扩增后仍有较好的攻击效果。上述投毒攻击方案是在随机的方向上对模型进行改变，为了使攻击效果更加明显，投毒样本往往需要在模型训练过程中产生更大的梯度，才能使训练得到的模型参数的原始分布和新分布变得可区分。
[0004]但是在随机梯度下降的过程中会进行梯度裁剪操作，该操作是指对大于某一阈值的梯度按特定比例进行缩小。而现有投毒攻击为了攻击效果生成的投毒样本往往会产生较大的梯度，也就导致了现有的投毒攻击对梯度裁剪操作是敏感的。也就是说，深度学习中随机梯度下降算法的梯度裁剪操作会削弱现有投毒攻击的攻击效果。

技术实现思路

[0005]本公开...

【技术保护点】

【技术特征摘要】
1.一种数据投毒攻击方法，其特征在于，包括如下步骤：建立目标模型；获取目标模型中权重参数w的梯度；计算梯度数据分布方差最小的方向作为投毒攻击模型修改的方向进行训练；使用训练后的投毒攻击模型生成投毒样本；所述梯度的计算公式如下：
ꢀꢀ
(1)其中，代表损失函数，训练样本，原始训练集为D=（X,Y），其中X是特征集，Y是标签集，b为模型的偏置参数。2.如权利要求1所述的数据投毒攻击方法，其特征在于，所述生成投毒样本的计算公式如下：（2）其中，表示使目标函数Var[]取最小值时的。3.如权利要求1或2所述的数据投毒攻击方法，其特征在于，为所述方差计算设定一个上界以计算所述上界的最小值。4.如权利要求3所述的数据投毒攻击方法，其特征在于，所述生成投毒样本的计算公式如下：（3），（4），其中，表示使目标函数Var[]取最小值时的，代表投毒样本的特征向量，x代表原始训练样本的特征向量，函数计算和x的方差，公式（4）表示是令函数取得最小值时的自变量值。5.如权利要求4所述的数据投毒攻击方法，其特征在于，公式（4）采用奇异值分解的方法来求解，具...

【专利技术属性】
技术研发人员：郑飞州，
申请(专利权)人：广州中平智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人