一种身份证篡改自动识别与定位的方法技术

技术编号:33959913 阅读:65 留言:0更新日期:2022-06-30 00:19
本发明专利技术公开了一种身份证篡改自动识别与定位的方法,包括以下步骤:S1、将待检测图片A输入训练后的rankiqa模型,对图片A进行质量判断;S2、保持图片B1中图像的长宽比不变,将图片B1调整大小为长边为2048像素的图片C;S3、图片C输入训练后的HRNet模型,预测结果插值处理成图片B1的尺寸,并保存为mask图片D,再将图片B1与mask图片D相乘,获得图片E;S4、图片E输入训练后的CAT

【技术实现步骤摘要】
一种身份证篡改自动识别与定位的方法


[0001]本专利技术涉及卡证篡改识别
,尤其涉及一种身份证篡改自动识别与定位的方法。

技术介绍

[0002]金融行业常常需要对一些卡证照片上传后进行人工审核,但是人工审核需要大量的人力资源,而且由于审核工作繁琐容易审核出错,且金融领域中卡证多样,拍照背景不可控,存在背景噪声大等问题,因此图像篡改识别技术很难只用一种识别方法能够全面且准确地对篡改区域进行定位和分类。
[0003]首先,传统篡改识别算法在少数篡改类型或特定数据集表现有效果,算法的通用性比较差,比如ela算法只对jpeg图像有效,对于png图片或gif图片无效;
[0004]其次,基于深度学习方法的图像篡改识别需要大量的数据集才能保证篡改识别的准确率,但是制作篡改检测数据集需要大量的人工标注,而且目前深度学习主要围绕forged篡改类型展开,在图像全局后处理如滤波等表现的效果比较差,这是由于深度学习篡改识别方法对图像质量有一定的要求,才能保证识别准确率;
[0005]最后,目前篡改识别算法由于不同场景拍摄、光线和拍摄抖动等原因造成运动模糊等情况都会导致图像质量较低,容易导致篡改识别结果出错,在卡证方面,如身份证拍摄上传的图像背景不可控,拍照环境不可控,拍摄质量不可控导致身份证照片篡改识别结果出错。

技术实现思路

[0006]为了解决上述
技术介绍
中所提到的技术问题,而提出的一种身份证篡改自动识别与定位的方法。
[0007]为了实现上述目的,本专利技术采用了如下技术方案
[0008]一种身份证篡改自动识别与定位的方法,包括以下步骤:
[0009]S1、将待检测图片A输入训练后的rankiqa模型,对图片A进行质量判断,若图片A满足图片质量要求则输出,反之则过滤:
[0010]S11、将图片A以中心点为基准裁剪为宽高比为1的图片B,并将图片B缩放到(224,224,3);
[0011]S12、图片B输入到轻量骨架网络mobilentv3

large,并通过sigmoid函数计算图片B的分数b;
[0012]S13、输出分数b∈(a,1)的图片B1,图片B1即满足图片质量要求的图片A,过滤b∈(0,a]图片B2,图片B2即被过滤的图片A,其中,a为图像质量阈值;
[0013]S2、保持图片B1中图像的长宽比不变,将图片B1调整大小为长边为2048像素的图片C;
[0014]S3、图片C输入训练后的HRNet模型,预测结果插值处理成图片B1的尺寸,并保存为
mask图片D,再将图片B1与mask图片D相乘,获得图片E,图片E只包含目标图像且背景全黑;
[0015]S4、图片E输入训练后的CAT

Net模型判定图像是否篡改,CAT

Net模型使用高分辨率网络HRNet模型结构:
[0016]S41、通过jpegio的coef_arrays和quant_tables方法获取图片E的DCT系数矩阵和量化表矩阵,用0填补DCT系数矩阵;
[0017]S42、将图片E尺寸修正为8的倍数,空白像素使用图片像素对应的灰度值127.5填补,归一化后获得RGB信息;
[0018]S43、通过Fusion Stage,先将RGB信息通过RGB Stream,输出分辨率为图片E尺寸的(1/4、1/8、1/16、1/32)的特征图F1,将DCT系数矩阵和量化表矩阵通过DCT Stream后,输出分辨率为图片E尺寸的(1/4、1/8、1/16)的特征图F2,再将特征图F1、F2融合成图片E尺寸的1/4的总特征图F,并输出结果为(2,H/4,W/4)的矩阵,即获得图片E的mask结果,其中,2表示图片E的热图和篡改热图,H和W表示图片E的高和宽;
[0019]S44、通过mask结果判断和定位图片E的篡改区域,如果图片E存在篡改区域,则对应像素值为1,否则为0。
[0020]作为上述技术方案的进一步描述:
[0021]所述rankiqa模型的训练方法包括以下步骤:
[0022]S101、图像质量分析数据集准备:使用不同拍摄设备采集正反面身份证参考图片至少217张,对每张图片进行高斯模糊、增加白噪声、jepg压缩和jepg2000压缩四种不同级别畸变失真的操作,生成至少4340张图片,即至少生成对比图片4340对训练图片,作为图像质量分析数据集;
[0023]S102、将图像质量分析数据集按照9:1分割成训练集和验证集;
[0024]S103、将训练集成对输入rankiqa模型中对模型进行训练,直到训练集的损失函数不再下降时停止训练,获得训练后的rankiqa模型。
[0025]作为上述技术方案的进一步描述:
[0026]所述HRNet模型的训练方法包括以下步骤:
[0027]S301、图像分割数据集准备:选择不同场景拍摄图片、扫描图片和网络图片至少1215张,使用labelme数据分割标注,获得图像分割数据集;
[0028]S302、将图像分割数据集按照7:2:1分割成训练集、验证集和测试集;
[0029]S303、将训练集输入HRNet模型中,对HRNet模型进行训练,当训练集的IOU值不再上升时停止训练,获得训练后的HRNet模型,IOU表示训练集中输入HRNet模型的图片预测结果和输入图片的真实值的交集与并集的比值。
[0030]作为上述技术方案的进一步描述:
[0031]所述CAT

Net模型的训练方法包括以下步骤:
[0032]S401、图像篡改数据集准备:S4011、通过217张原图人工标注出至少615标注图片,PS自动涂鸦后人工标注至少1112张,共计不少于1763张图片;
[0033]S4012、至少1763张图片通过训练后的HRNet模型输出掩码与输入原图所得到的目标图像背景全黑的图片至少1763张,根据输入原图尺寸生成对应的全黑掩码图片至少217张,共计不少于3743张图片,作为图像篡改数据集;
[0034]S402、将图像篡改数据集按照9:1分隔成训练集和验证集;
[0035]S403、将训练集输入CAT

Net模型,获得训练后的CAT

Net模型,直到训练集的损失函数不再下降时停止训练,获得训练后的CAT

Net模型。
[0036]作为上述技术方案的进一步描述:
[0037]所述待检测图片A的图像分辨率至少为500*500。
[0038]作为上述技术方案的进一步描述:
[0039]rankiqa模型的图片质量分析指标使用LCC线性相关系数和SROCC秩相关系数:
[0040]LCC∈(0,1),其中,y
i
和分别是第i个图片的实际分数和预测分数,预测分数即指第i个图片通过rankqia模型输出的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种身份证篡改自动识别与定位的方法,其特征在于,包括以下步骤:S1、将待检测图片A输入训练后的rankiqa模型,对图片A进行质量判断,若图片A满足图片质量要求则输出,反之则过滤:S11、将图片A以中心点为基准裁剪为宽高比为1的图片B,并将图片B缩放到(224,224,3);S12、图片B输入到轻量骨架网络mobilentv3

large,并通过sigmoid函数计算图片B的分数b;S13、输出分数b∈(a,1)的图片B1,图片B1即满足图片质量要求的图片A,过滤b∈(0,a]图片B2,图片B2即被过滤的图片A,其中,a为图像质量阈值;S2、保持图片B1中图像的长宽比不变,将图片B1调整大小为长边为2048像素的图片C;S3、图片C输入训练后的HRNet模型,预测结果插值处理成图片B1的尺寸,并保存为mask图片D,再将图片B1与mask图片D相乘,获得图片E,图片E只包含目标图像且背景全黑;S4、图片E输入训练后的CAT

Net模型判定图像是否篡改,CAT

Net模型使用高分辨率网络HRNet模型结构:S41、通过jpegio的coef_arrays和quant_tables方法获取图片E的DCT系数矩阵和量化表矩阵,用0填补DCT系数矩阵;S42、将图片E尺寸修正为8的倍数,空白像素使用图片像素对应的灰度值127.5填补,归一化后获得RGB信息;S43、通过Fusion Stage,先将RGB信息通过RGB Stream,输出分辨率为图片E尺寸的(1/4、1/8、1/16、1/32)的特征图F1,将DCT系数矩阵和量化表矩阵通过DCT Stream后,输出分辨率为图片E尺寸的(1/4、1/8、1/16)的特征图F2,再将特征图F1、F2融合成图片E尺寸的1/4的总特征图F,并输出结果为(2,H/4,W/4)的矩阵,即获得图片E的mask结果,其中,2表示图片E的热图和篡改热图,H和W表示图片E的高和宽;S44、通过mask结果判断和定位图片E的篡改区域,如果图片E存在篡改区域,则对应像素值为1,否则为0。2.根据权利要求1所述的一种身份证篡改自动识别与定位的方法,其特征在于,所述rankiqa模型的训练方法包括以下步骤:S101、图像质量分析数据集准备:使用不同拍摄设备采集正反面身份证参考图片至少217张,对每张图片进行高斯模糊、增加白噪声、jepg压缩和jepg2000压缩四种不同级别畸变失真的操作,生成至少4340张图片,即至少生成对比图片4340对训练图片,作为图像质量分析数据集;S102、将图像质量分析数据集按照9:1分割成训练集和验证集;S103、将训练集成对输入rankiqa模型中对模型进行训练,直到训练集的损失函数不再下降时停止训练,获得训练后的rankiqa模型。3.根据权利要求1所述的一种身份证篡改自动识别与定位的方法...

【专利技术属性】
技术研发人员:陈再蝶朱晓秋章星星樊伟东
申请(专利权)人:浙江康旭科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1