一种基于改进UNet网络的数字图像篡改定位方法技术

技术编号:37711366 阅读:18 留言:0更新日期:2023-06-02 00:04
本发明专利技术公开了一种基于改进UNet网络的数字图像篡改定位方法,涉及数字图像取证领域。本发明专利技术结合深度学习领域最新的技术注意力机制,改进了模型的Encoder特征提取模块,在模型的特征提取结构中融入了通道注意力机制和空间注意力机制,模型特征提取更为充分,模型的定位精度更高。定位精度更高。定位精度更高。

【技术实现步骤摘要】
一种基于改进UNet网络的数字图像篡改定位方法


[0001]本专利技术涉及数字图像取证领域,尤其涉及一种基于改进UNet网络的数字图像篡改定位方法。

技术介绍

[0002]随着多媒体技术的迅速发展以及互联网的普及,社交媒体逐渐成为当下最主要的信息传播平台,其中数字图像以其直观且信息量丰富的特点在社交媒体中扮演着不可或缺的角色,但是同时也带来了诸多困扰与挑战。近年来,数字图像编辑软件不断普及,对数字图像进行编辑篡改越来越简单方便,编辑效果也越来越难以被人眼鉴别,这给判断数字图像的真伪带来了很大挑战。部分数字图像编辑软件的用户对数字图像进行编辑仅仅是为了娱乐或是美化图片,但是也存在越来越多的数字图像恶意篡改用于虚假消息的传播、作伪证等恶意目的。数字图像恶意篡改会严重扰乱社会秩序、司法公正,甚至危及国家安全,因此急需相应的篡改图像检测方法,判断数字图像是否经过了人为的编辑。对篡改图像中的篡改痕迹进行检测的数字图像取证技术受到了工业界与学术界越来越多的关注。
[0003]在数字图像取证领域,主要分为两个任务:图像篡改检测,图像篡改定位。数字图像篡改检测的主要目的是判断图像是否经过了篡改,而数字图像篡改定位则是需要在篡改图像上具体标定出篡改的区域。在司法鉴定等特殊场合,标定出篡改区域的定位任务比仅仅判断图像是否被篡改的检测任务更有价值,因此本专利技术主要聚焦于图像篡改定位的研究。目前对图像篡改定位的研究主要分为两大类,基于手工特征的传统数字图像取证技术和基于深度学习的数字图像取证技术。传统的图像篡改定位技术通常针对图像中的语义信息如阴影、光照和运动模糊等线索设计手工特征,进行特征提取和篡改区域的定位,但是这些算法往往都只适用于部分特定条件下的图像,算法的通用性和鲁棒性欠佳。随着深度学习技术在计算机视觉领域的发展,研究者也尝试采用深度学习算法完成图像篡改定位任务。基于深度学习的图像篡改定位技术主要分为目标检测和语义分割两个类别,目标检测的方案主要通过构建Faster R

CNN等目标检测模型对图像中篡改区域进行识别和定位,但其定位精度有限,更多的研究者将研究重心转向使用语义分割技术实现对图像篡改区域的检测和定位。语义分割的方案主要通过设计全卷积网络FCN,U型网络UNet,环状残差U型网络RRUNet等语义分割模型,来实现对篡改区域的定位,其中RRUNet在该项任务中表现优异,故本专利技术也基于这一经典结构展开。但当前大部分语义分割模型均使用卷积操作提取特征,卷积操作具有一定的局部性,未能考虑特征的全局信息,这样的模型并不能很好的完成图像篡改定位任务。
[0004]因此,本领域的技术人员致力于开发一种基于改进UNet网络的数字图像篡改定位方法。结合注意力机制关注全局信息,有效提高模型对重要特征的关注程度,使图像篡改定位网络更加准确高效。

技术实现思路

[0005]有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是RRUNet网络在模型的学习过程中没有关注到特征图中不同通道的重要程度,不同坐标位置的重要程度。
[0006]为实现上述目的,本专利技术提供了一种基于改进UNet网络的数字图像篡改定位方法,包括以下步骤:
[0007]步骤1、数据集的准备和预处理;
[0008]步骤2、数字图像篡改定位模型搭建,在模型的特征提取结构中融入了通道注意力机制和空间注意力机制;
[0009]步骤3、模型训练;
[0010]步骤4、模型测试与评估。
[0011]进一步地,所述步骤1,数据集包括CASIA1.0数据集、CASIA2.0数据集、Columbia数据集和SAN数据集。
[0012]进一步地,所述步骤1,预处理包括图像尺寸上的预处理。
[0013]进一步地,所述步骤1,将图像缩放到256
×
256像素。
[0014]进一步地,所述步骤2,基于RRUNet,搭建改进的UNet网络结构模型。
[0015]进一步地,所述步骤2,模型结构为Encoder

Decoder结构,其中Encoder负责对输入图像进行特征的提取,Decoder负责对深层和浅层的特征进行增强,以及对特征图的尺度进行恢复。
[0016]进一步地,所述步骤2,模型由Conv Block组成。
[0017]进一步地,所述步骤2,使用通道注意力模块SE Block对特征进行筛选。
[0018]进一步地,所述步骤2,使用空间注意力模块CA Block,实现对特征图空间维度上的筛选。
[0019]进一步地,所述步骤4,评测指标包括F1 Score和AUC。
[0020]在本专利技术的较佳实施方式中,针对RRUNet网络在模型的学习过程中没有关注到特征图中不同通道的重要程度,在模型的特征提取结构中融入了通道注意力机制,通道注意力旨在让网络模型更加关注特征图不同通道的重要程度,学习到重要的特征,舍弃不重要的特征。
[0021]针对RRUNet网络在模型的学习过程中没有关注到特征图中不同坐标位置的重要程度,在模型的特征提取结构中融入了空间注意力机制,空间注意力旨在让网络模型更加关注特征图不同位置坐标的重要程度,学习到重要的特征,舍弃不重要的特征。
[0022]本专利技术与现有技术相比较,具有如下显而易见的实质性特点和显著优点:
[0023]1.相较于RRUNet网络使用卷积操作提取的较平均的特征,结合通道注意力提取的特征能够辨别出特征图中不同通道的重要程度,更加关注到某些通道的重要特征,在实验所用的CASIA1.0和Columbia数据集上F1验证指标分别从原来的65.5%和93%提升到72.2%和93.2%。
[0024]2.相较于RRUNet网络使用卷积操作提取的具有空间局部性特点的特征图,结合空间注意力机制提取的特征能够具有一定的全局信息,更加关注到某些坐标位置的重要特征,更好学习到了样本的真实特征,在实验所用的CASIA1.0和Columbia数据集上F1验证指标分别从原来的65.5%和93%提升到72.1%和93.1%。
[0025]3.本专利技术结合注意力机制关注全局信息,有效提高模型对重要特征的关注程度,使图像篡改定位网络更加准确高效。
[0026]4.本专利技术综合利用了通道注意力技术和空间注意力技术对深度网络模型进行改进,最后实现对进行数字图像篡改的定位,根据评测指标所示,改进后的模型能够更加关注有用的信息,提升了网络的分割定位能力。在司法鉴定等需要对篡改图像进行检测和定位的业务场景下,具有较好的应用前景。
[0027]以下将结合附图对本专利技术的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本专利技术的目的、特征和效果。
附图说明
[0028]图1是本专利技术的一个较佳实施例的基于改进UNet网络模型的图像篡改定位方法的流程示意;
[0029]图2是本专利技术的一个较佳实施例的改进UNet网络模型的整体结构;
[0030]图3是本专利技术的一个较佳本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进UNet网络的数字图像篡改定位方法,其特征在于,包括以下步骤:步骤1、数据集的准备和预处理;步骤2、数字图像篡改定位模型搭建,在模型的特征提取结构中融入了通道注意力机制和空间注意力机制;步骤3、模型训练;步骤4、模型测试与评估。2.如权利要求1所述的基于改进UNet网络的数字图像篡改定位方法,其特征在于,所述步骤1,数据集包括CASIA1.0数据集、CASIA2.0数据集、Columbia数据集和SAN数据集。3.如权利要求1所述的基于改进UNet网络的数字图像篡改定位方法,其特征在于,所述步骤1,预处理包括图像尺寸上的预处理。4.如权利要求1所述的基于改进UNet网络的数字图像篡改定位方法,其特征在于,所述步骤1,将图像缩放到256
×
256像素。5.如权利要求1所述的基于改进UNet网络的数字图像篡改定位方法,其特征在于,所述步骤2,基于RRUNet,搭建改进的UNet网络结构模型。6....

【专利技术属性】
技术研发人员:郭颖姜山李海虎晋洋旗蔡兴泉
申请(专利权)人:北方工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1