【技术实现步骤摘要】
一种基于注意力的对象语义一致性篡改图像检测方法
[0001]本专利技术涉及图像取证
,特别是一种基于注意力的对象语义一致性篡改图像检测方法。
技术介绍
[0002]图像作为信息交流的媒介被广泛应用于各行各业,但图像编辑技术的普及也使得图像篡改操作变得容易。篡改后的图像破坏了图像内容的完整性,若被用于非法用途将对网络空间安全的稳定带来影响。因此,篡改图像检测已成为信息安全领域多媒体取证技术的一个急需解决的问题。篡改图像对自然图像进行编辑,篡改区域来源图像为供体图像,接收篡改区域的图像成为受体图像。根据供体图像和受体图像之间的来源一致性可将篡改图像分为同源篡改图像和异源篡改图像。其中,同源篡改图像中供体和受体图像为同一张图像,例如复制粘贴(copy
‑
move)篡改图像。异源篡改中供体和受体图像非同一张图像,且供体图像可能有多张,例如拼接(splicing)篡改图像。篡改过程会留下固有痕迹,如篡改区域边缘的不连续性以及篡改区域与非篡改区域的不一致性等,可用于检测篡改图像以及定位篡改的区域。在图像拼接篡改中,图像的原始语义信息往往会发生变化,且拼接篡改操作的对象也往往具有完整的语义信息。但是,现有基于深度学习的篡改图像检测方法无法将对象语义一致性与可疑的篡改痕迹充分结合,在更大的感受野内提取篡改图像的信息进行检测。例如在文献《The point where reality meets fantasy:mixed adversarial generators for image splice dete ...
【技术保护点】
【技术特征摘要】
1.一种基于注意力的对象语义一致性篡改图像检测方法,采用基于注意力机制构建的编码器,分别对图像中对象层级的语义信息和像素层级的篡改痕迹信息进行特征提取与表示,生成对象语义表示和篡改痕迹表示,并通过一个解码器对两种不同的编码进行融合与解码,从而实现图像的拼接篡改检测与定位,包括以下步骤:步骤1:构造基于自注意力机制的对象语义编码器,其中包括一个前置卷积模块,8个堆叠的对象语义编码模块和多层感知机;步骤2:构造基于注意力的篡改痕迹编码器,获得图像中色彩分量和高频分量的篡改痕迹;步骤3:构造融合解码器,结合步骤1和步骤2所获的对象语义信息和篡改痕迹信息定位篡改区域;步骤4:在训练阶段通过损失函数为步骤1至步骤3所得算法提供整体约束,以使算法中的各项参数调整至最优值。2.如权利要求1所述的一种基于注意力的对象语义一致性篡改图像检测方法,其特征在于,在步骤1中,实现对象语义编码的具体方法为:(1)使用前置卷积模块对长为H宽为W维度为C的待检测图像I
H
×
W
进行浅层特征提取,预设滑动窗口的大小k
×
k,滑动步长s、填充大小p,该过程表示为:OSB
i
=cut(Conv(I
H
×
W
))其中,Conv(
·
)表示前置卷积模块的卷积操作,cut(
·
)表示切块操作;(2)对象语义编码模块首先使用位置编码对OSB
i
进行更新,生成更新后的序列块,该过程表示为:其中,embedding(
·
)表示位置编码;(3)由多头自注意力层对图像块序列之间存在的对象级语义一致性关系进行建模,该计算过程表示为:计算过程表示为:其中,为初次得到的对象语义表征模型,d
hea
为可以调节的特征缩放系数,在本方法中一般d
head
=64,softmax(
·
)表示softmax函数;K
e
,Q
e
和V
e
均为可学习的线性投影层输出的的线性映射,即注意力机制计算所的查询、键、值向量,其维度与一致,均为在此处N为可调节的参数,本方法中N=16,表示一幅图像中可能包含的语义对象的最大数量,C为的通道数;(4)使用多层感知机来获取同一图像不同对象之间的语义关联性,学习不同对象原型之间如何进行交互;最后由多层感知机和激活函数来对模块得到的对象语义模型进行增强,以实现更好的泛化性;该过程表示为:
其中,W
C
是可多层感知机中可学习的参数;其中,OS
i
为对象语义编码器获得的对象语义表示,GELU(
·
)表示GELU激活函数,MLP(
·
)表示多层感知机的线性映射操作。3.如权利要求1所述的一种基于注意力的对象语义一致性篡改图像检测方法,其特征在于,在步骤2中,提取篡改痕迹的具体方法为:(1)提取色彩分量对应的篡改痕迹表示FC
RGB
;(2)提取高频分量对应的篡改痕迹表示FC
HF
;(3)将FC
RGB
与FC
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。