【技术实现步骤摘要】
一种抵抗JPEG压缩的对抗样本的生成方法
[0001]本专利技术涉及一种对抗样本生成技术,尤其是涉及一种抵抗JPEG(Joint PhotographicExperts Group,联合图像专家小组)压缩的对抗样本的生成方法,其生成的对抗样本可以更好地抵抗JPEG压缩。
技术介绍
[0002]随着社交网络等新媒体技术的飞速发展,大量图片在互联网上传播。若这些图片在信道上以原始图片的方式进行传输时,需要占用大量的传输空间和存储空间,增加相关内容服务提供商的存储成本。因此,为了解决这个问题,传输前需要对原始图片进行压缩,以减少图片传输和存储所需要的成本。传统的压缩方法可分为有损压缩和无损压缩。无损压缩是指数据经过压缩后,信息不被破坏,压缩过程完全可逆,即可以将数据恢复原样。有损压缩是指将次要的数据舍弃,牺牲一些质量来减少数据量、提高压缩比。无损压缩常用于对图像质量要求较高的应用场景;有损压缩则更适合用户规模较大的场景,如社交网络。JPEG压缩技术是图像中最常见也是最通用的有损压缩技术,其特点是可以根据不同的压缩因子,对图像进行不同强度的压缩。JPEG压缩的一般流程如图1所示,编码过程首先将RGB格式的图像转换为YCrCb格式,然后进行分块和离散余弦变换(Discrete Cosine Transform,DCT),再对DCT系数进行量化,最后将量化后的系数进行熵编码;解码过程首先进行熵解码得到DCT系数,然后将解码后的DCT系数进行逆DCT变换,转换到像素空间,最后将得到的像素块组成图像,并由YCrCb格式转换回RGB格
【技术保护点】
【技术特征摘要】
1.一种抵抗JPEG压缩的对抗样本的生成方法,其特征在于包括训练阶段和测试阶段;所述的训练阶段的具体过程为:步骤1_1:选取Q张原始RGB图像;然后将每张原始RGB图像缩放成256
×
256大小的图像;再对每张256
×
256大小的图像在其中心区域内进行随机裁剪,裁剪成224
×
224大小的图像,定义为裁剪图像;接着将每张裁剪图像输入到图像质量评价器中,图像质量评价器输出每张裁剪图像的质量得分,作为对应的原始RGB图像的真实质量得分;之后将所有原始RGB图像及每张原始RGB图像的真实质量得分构成训练集;再将训练集中的每张原始RGB图像对应的裁剪图像分割成625个相互重叠的32
×
32大小的图像块;其中,Q≥1,图像块与图像块之间重叠8个像素点;步骤1_2:构建空间形变网络:该空间形变网络包括定位网络和取样模块;定位网络为一个卷积神经网络,其由依次连接的第一卷积块、第二卷积块、第三卷积块、第四卷积块、全连接层组成,第一卷积块由依次连接的第一卷积层、第一批归一化层、第一LeakyReLu激活函数组成,第二卷积块由依次连接的第二卷积层、第二批归一化层、第二LeakyReLu激活函数组成,第三卷积块由依次连接的第三卷积层、第三批归一化层、第三LeakyReLu激活函数、平均池化层组成,第四卷积块由依次连接的第四卷积层、第四批归一化层、第四LeakyReLu激活函数组成,第一卷积层的输入端接收一张32
×
32大小的RGB图像的三通道,第一批归一化层的输入端接收第一卷积层的输出端输出的64张15
×
15大小的特征图,第一LeakyReLu激活函数的输入端接收第一批归一化层的输出端输出的64张15
×
15大小的特征图,第二卷积层的输入端接收第一LeakyReLu激活函数的输出端输出的64张15
×
15大小的特征图,第二批归一化层的输入端接收第二卷积层的输出端输出的64张7
×
7大小的特征图,第二LeakyReLu激活函数的输入端接收第二批归一化层的输出端输出的64张7
×
7大小的特征图,第三卷积层的输入端接收第二LeakyReLu激活函数的输出端输出的64张7
×
7大小的特征图,第三批归一化层的输入端接收第三卷积层的输出端输出的64张3
×
3大小的特征图,第三LeakyReLu激活函数的输入端接收第三批归一化层的输出端输出的64张3
×
3大小的特征图,平均池化层的输入端接收第三LeakyReLu激活函数的输出端输出的64张3
×
3大小的特征图,第四卷积层的输入端接收平均池化层的输出端输出的64张2
×
2大小的特征图,第四批归一化层的输入端接收第四卷积层的输出端输出的6张2
×
2大小的特征图,第四LeakyReLu激活函数的输入端接收第四批归一化层的输出端输出的6张2
×
2大小的特征图,全连接层的输入端接收第四LeakyReLu激活函数的输出端输出的6张2
×
2大小的特征图,全连接层的输出端输出由6个数值构成的向量;其中,第一卷积层的输入通道数为3、输出通道数为64、卷积核的大小为5、卷积核的步长为2、填充为1,第二卷积层的输入通道数为64、输出通道数为64、卷积核的大小为5、卷积核的步长为2、填充为1,第三卷积层的输入通道数为64、输出通道数为64、卷积核的大小为5、卷积核的步长为2、填充为1,平均池化层的平均池化核的大小为2
×
2,第四卷积层的输入通道数为64、输出通道数为6、卷积核的大小为1、卷积核的步长为1、填充为0,第一LeakyReLu激活函数、第二LeakyReLu激活函数、第三LeakyReLu激活函数、第四LeakyReLu激活函数的激活参数均为0.2,全连接层的神经元个数为6;取样模块将全连接层的输出端输出的向量中的前3个数值作为第一行、后3个数值作为第二行构成一个矩阵,记为θ;然后将输入定位网络的32
×
32大小的RGB图像及对应的矩阵θ
输入到网格函数中,网格函数输出形变后的32
×
32大小的块,定义为形变块;再计算形变块中的每个像素点的像素值,对于形变块中的任一个像素点,当在输入定位网络的32
×
32大小的RGB图像中找到与该像素点的坐标位置有对应关系的坐标位置时,该像素点的像素值等于找到的坐标位置上的像素点的像素值;当在输入定位网络的32
×
32大小的RGB图像中找不到与该像素点的坐标位置有对应关系的坐标位置时,先使用双线性插值法获取该像素点的插值坐标位置,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。