一种抵抗JPEG压缩的对抗样本的生成方法技术

技术编号：34942049 阅读：25 留言：0更新日期：2022-09-17 12:15

本发明专利技术公开了一种抵抗JPEG压缩的对抗样本的生成方法，其利用设计好的空间形变网络对图像形变，使得生成的对抗样本在公共信道传播时能抵抗可能的压缩；空间形变网络由定位网络和取样模块组成，定位网络由多个卷积层和池化层等组成，通过对图像进行对应空间坐标值的计算得到形变图像；将训练集中的图像块放入空间形变网络进行训练，得到形变图像块，然后将得到的形变图像块进行提取、拼接得到与原始样本相同大小的对抗样本；在测试阶段，通过对得到的对抗样本进行图像质量的评估来衡量对抗样本经过JPEG压缩后的对抗性是否下降；优点是其生成的对抗样本在公共信道上进行传播时能更好地抵抗JPEG压缩，进而保证了经过传播后的对抗样本依然具有很好的攻击性。抗样本依然具有很好的攻击性。抗样本依然具有很好的攻击性。

全部详细技术资料下载

【技术实现步骤摘要】
一种抵抗JPEG压缩的对抗样本的生成方法

[0001]本专利技术涉及一种对抗样本生成技术，尤其是涉及一种抵抗JPEG(Joint PhotographicExperts Group，联合图像专家小组)压缩的对抗样本的生成方法，其生成的对抗样本可以更好地抵抗JPEG压缩。

技术介绍

[0002]随着社交网络等新媒体技术的飞速发展，大量图片在互联网上传播。若这些图片在信道上以原始图片的方式进行传输时，需要占用大量的传输空间和存储空间，增加相关内容服务提供商的存储成本。因此，为了解决这个问题，传输前需要对原始图片进行压缩，以减少图片传输和存储所需要的成本。传统的压缩方法可分为有损压缩和无损压缩。无损压缩是指数据经过压缩后，信息不被破坏，压缩过程完全可逆，即可以将数据恢复原样。有损压缩是指将次要的数据舍弃，牺牲一些质量来减少数据量、提高压缩比。无损压缩常用于对图像质量要求较高的应用场景；有损压缩则更适合用户规模较大的场景，如社交网络。JPEG压缩技术是图像中最常见也是最通用的有损压缩技术，其特点是可以根据不同的压缩因子，对图像进行不同强度的压缩。JPEG压缩的一般流程如图1所示，编码过程首先将RGB格式的图像转换为YCrCb格式，然后进行分块和离散余弦变换(Discrete Cosine Transform，DCT)，再对DCT系数进行量化，最后将量化后的系数进行熵编码；解码过程首先进行熵解码得到DCT系数，然后将解码后的DCT系数进行逆DCT变换，转换到像素空间，最后将得到的像素块组成图像，并由YCrCb格式转换回RGB格

【技术保护点】

【技术特征摘要】
1.一种抵抗JPEG压缩的对抗样本的生成方法，其特征在于包括训练阶段和测试阶段；所述的训练阶段的具体过程为：步骤1_1：选取Q张原始RGB图像；然后将每张原始RGB图像缩放成256
×
256大小的图像；再对每张256
×
256大小的图像在其中心区域内进行随机裁剪，裁剪成224
×
224大小的图像，定义为裁剪图像；接着将每张裁剪图像输入到图像质量评价器中，图像质量评价器输出每张裁剪图像的质量得分，作为对应的原始RGB图像的真实质量得分；之后将所有原始RGB图像及每张原始RGB图像的真实质量得分构成训练集；再将训练集中的每张原始RGB图像对应的裁剪图像分割成625个相互重叠的32
×
32大小的图像块；其中，Q≥1，图像块与图像块之间重叠8个像素点；步骤1_2：构建空间形变网络：该空间形变网络包括定位网络和取样模块；定位网络为一个卷积神经网络，其由依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块、全连接层组成，第一卷积块由依次连接的第一卷积层、第一批归一化层、第一LeakyReLu激活函数组成，第二卷积块由依次连接的第二卷积层、第二批归一化层、第二LeakyReLu激活函数组成，第三卷积块由依次连接的第三卷积层、第三批归一化层、第三LeakyReLu激活函数、平均池化层组成，第四卷积块由依次连接的第四卷积层、第四批归一化层、第四LeakyReLu激活函数组成，第一卷积层的输入端接收一张32
×
32大小的RGB图像的三通道，第一批归一化层的输入端接收第一卷积层的输出端输出的64张15
×
15大小的特征图，第一LeakyReLu激活函数的输入端接收第一批归一化层的输出端输出的64张15
×
15大小的特征图，第二卷积层的输入端接收第一LeakyReLu激活函数的输出端输出的64张15
×
15大小的特征图，第二批归一化层的输入端接收第二卷积层的输出端输出的64张7
×
7大小的特征图，第二LeakyReLu激活函数的输入端接收第二批归一化层的输出端输出的64张7
×
7大小的特征图，第三卷积层的输入端接收第二LeakyReLu激活函数的输出端输出的64张7
×
7大小的特征图，第三批归一化层的输入端接收第三卷积层的输出端输出的64张3
×
3大小的特征图，第三LeakyReLu激活函数的输入端接收第三批归一化层的输出端输出的64张3
×
3大小的特征图，平均池化层的输入端接收第三LeakyReLu激活函数的输出端输出的64张3
×
3大小的特征图，第四卷积层的输入端接收平均池化层的输出端输出的64张2
×
2大小的特征图，第四批归一化层的输入端接收第四卷积层的输出端输出的6张2
×
2大小的特征图，第四LeakyReLu激活函数的输入端接收第四批归一化层的输出端输出的6张2
×
2大小的特征图，全连接层的输入端接收第四LeakyReLu激活函数的输出端输出的6张2
×
2大小的特征图，全连接层的输出端输出由6个数值构成的向量；其中，第一卷积层的输入通道数为3、输出通道数为64、卷积核的大小为5、卷积核的步长为2、填充为1，第二卷积层的输入通道数为64、输出通道数为64、卷积核的大小为5、卷积核的步长为2、填充为1，第三卷积层的输入通道数为64、输出通道数为64、卷积核的大小为5、卷积核的步长为2、填充为1，平均池化层的平均池化核的大小为2
×
2，第四卷积层的输入通道数为64、输出通道数为6、卷积核的大小为1、卷积核的步长为1、填充为0，第一LeakyReLu激活函数、第二LeakyReLu激活函数、第三LeakyReLu激活函数、第四LeakyReLu激活函数的激活参数均为0.2，全连接层的神经元个数为6；取样模块将全连接层的输出端输出的向量中的前3个数值作为第一行、后3个数值作为第二行构成一个矩阵，记为θ；然后将输入定位网络的32
×
32大小的RGB图像及对应的矩阵θ
输入到网格函数中，网格函数输出形变后的32
×
32大小的块，定义为形变块；再计算形变块中的每个像素点的像素值，对于形变块中的任一个像素点，当在输入定位网络的32
×
32大小的RGB图像中找到与该像素点的坐标位置有对应关系的坐标位置时，该像素点的像素值等于找到的坐标位置上的像素点的像素值；当在输入定位网络的32
×
32大小的RGB图像中找不到与该像素点的坐标位置有对应关系的坐标位置时，先使用双线性插值法获取该像素点的插值坐标位置，...

【专利技术属性】
技术研发人员：董理，鲁宁，严迪群，王让定，
申请(专利权)人：宁波大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人