【技术实现步骤摘要】
有毒样本数据生成方法及装置
[0001]本公开的实施例涉及网络攻防对抗样本生成
,尤其涉及一种毒样本数据生成方法、装置和电子设备。
技术介绍
[0002]基于逻辑回归模型函数的分类器在工业的应用十分广泛,例如在医疗系统中根据疾病的特征对疾病进行预测,以及在CTR(点击通过率)预估模型中进行预测等。
[0003]在上述领域中进行预测分类时,基于逻辑回归模型的分类器需要定期训练以更新模型,因此使网络攻击者可以利用有毒样本数据对合法模型的预测进行攻击,使合法模型预测的准确性大幅下降。
[0004]为了提高基于逻辑回归模型函数的分类器在进行预测时的安全性,需要一种有毒样本数据,可以在现实中的安全情况下,模拟网络攻击者对分类器的攻击行为,以实现网络攻防对抗的演练。
[0005]基于此,需要一种能够实现有毒样本数据生成的方案。
技术实现思路
[0006]有鉴于此,本公开的目的在于提出一种毒样本数据生成方法、装置和电子设备。
[0007]基于上述目的,本公开提供了有毒样本数据生成方法,包括:生成平台基于肿瘤预测分类器所训练的第一正常数据集,将肿瘤尺寸、肿瘤细胞特征和肿瘤类型作为第一正常数据集的各项特征,将肿瘤性状作为分类结果,以构建原始有毒数据集,并作为第0次迭代的有毒数据集,以启动有毒数据集和肿瘤预测分类器的迭代。
[0008]进一步的,在迭代过程中,生成平台响应于确定本次迭代的迭代次数为0,将原始有毒数据集与第一正常数据集融合,作为混合数据集,并继续本次迭代;生成平 ...
【技术保护点】
【技术特征摘要】
1.一种有毒样本数据生成方法,包括:生成平台基于肿瘤预测分类器所训练的第一正常数据集,将肿瘤尺寸、肿瘤细胞特征和肿瘤类型作为所述第一正常数据集的各项特征,将肿瘤性状作为分类结果,以构建原始有毒数据集,并作为第0次迭代的有毒数据集,以启动所述有毒数据集和所述肿瘤预测分类器的迭代;在迭代过程中,所述生成平台响应于确定本次迭代的迭代次数为0,将所述原始有毒数据集与所述第一正常数据集融合,作为混合数据集,并继续本次迭代;所述生成平台响应于确定本次迭代的次数大于0,将前一次完成迭代的所述有毒数据集与所述第一正常数据集融合,作为所述混合数据集,并继续本次迭代;基于建立的损失函数,所述生成平台对所述混合数据集进行内层优化,得到所述肿瘤预测分类器在本次迭代中的参数向量;采用参数向量判定策略,并根据迭代次数和参数值,决定是否结束所述迭代;响应于确定所述迭代未结束,所述生成平台基于建立的所述损失函数,利用本次迭代中得到的所述参数向量,对预设的第二正常数据集和所述有毒数据集进行外层优化,得到下一次迭代的有毒数据集;响应于确定所述迭代结束,将本次迭代中的所述有毒数据集作为有毒样本数据。2.根据权利要求1所述的方法,其中,所述构建原始有毒数据集,包括:利用所述肿瘤预测分类器对所述第一正常数据集进行训练,得到与所述第一正常数据集中输入的各个第一特征值所对应的第一分类结果;对所述第一正常数据集中的所述第一特征值与所述第一分类结果之间的对应关系进行翻转扭曲,以构建原始有毒数据集中的原始特征值、原始分类结果及其之间的对应关系。3.根据权利要求2所述的方法,其中,所述利用所述肿瘤预测分类器对所述第一正常数据集进行训练,包括:采取如下的逻辑回归模型的函数作为肿瘤预测分类器,对所述所述第一正常数据集进行训练:其中,表示所述肿瘤预测分类器在第i次迭代中的参数向量;e为常数参数;表示相应数据集中第k个数据对象所对应的各特征值构成的特征值向量;表示在第i次迭代中所对应的所述肿瘤预测分类器的分类结果;其中,。4.根据权利要求3所述的方法,其中,所述生成平台对所述混合数据集进行内层优化,得到所述肿瘤预测分类器在本次迭代中的参数向量,包括:建立如下的损失函数:其中,K表示数据集中所述数据对象的数量,且;表示相应数据集中第k个所述数据对象所对应的正确分类结果;表示所述肿瘤预测分类器在第i次迭代中的所述
参数向量;表示与第i次迭代中的所述参数向量所对应的所述损失函数值;采取对所述损失函数进行最小化计算,得到所述肿瘤预测分类器的所述参数向量。5.根据权利要求1所述的方法,其中,采用参数向量判定策略,并根据迭代次数和参数值,决定是否结束所述迭代,包括:采取如下参数公式,以获得参数b的所述参数值:其中,mod[]表示以i为被除数,以N为除数,执行除法计算求解余数的函数;i表示迭代次数,N表示所述混合数据集中有毒的数据对象的个数;响应于迭代次数不为0,且b=0,且本次迭代得到的所述参数向量与前一次迭代得到的所述参数向量之间的差值向量小于预设的溢出阈值,确定结束本次迭代。6.根据权利要...
【专利技术属性】
技术研发人员:高飞,杨芃溪,李文敏,张华,温巧燕,时忆杰,金正平,
申请(专利权)人:北京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。