System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 证件号码字体异常检测方法技术_技高网

证件号码字体异常检测方法技术

技术编号:41593680 阅读:8 留言:0更新日期:2024-06-07 00:04
本发明专利技术公开了证件号码字体异常检测方法,属于图像处理技术领域,包括利用正常证件号码建立单字符图像模板库、基于连通区域分析法在二值图上分割出单字符图像、字符匹配得出匹配N*M个概率值,设定规则,进行规则判断。本发明专利技术通用性强,可用于国内国外任一类型证件,便于迁移;不依赖训练学习模型,对于新增的异常字体类型,扩展性强;执行速度快;根据证件号码位数,可得到一系列字符相似度,通过多维度多层次的规则设计,准确率高,基于多字符模板匹配结构,可构造多层次的判断规则,增强鲁棒性,使用连通区域分析法获得证件号码图像单字符所在位置,获得的边界框紧贴字符区域,使得裁剪出来的字符更加精准。

【技术实现步骤摘要】

本专利技术涉及图像处理,尤其涉及证件号码字体异常检测方法


技术介绍

1、目前,在很多领域都需要进行证件识别,其中,该证件可以为身份证、护照、驾照等。例如,在银行办理业务时,需要用户出示身份证进行身份证的识别,以验证用户身份信息;用户乘坐高铁或者飞机等旅行工具时,需要对身份证进行识别。

2、某一国家某一类型证件(如身份证、驾驶证等),其证件号码的字体是确定的、一致的,并受版权保护,黑产在伪造证件号码时,多采用其他字体类型,与真实证件号码的字体有明显差异,所以,基于字体是否一致的鉴别而无需知道具体的字体类型,可有效鉴别证件号码是否异常,从而判断证件是否伪造,但现缺少直接通过证件的字体进行识别证件真伪的方法,为此现提出一种证件号码字体异常检测方法。


技术实现思路

1、本专利技术的目的是为了解决现有技术缺少直接通过证件号码的字体进行识别证件真伪的问题,而提出的证件号码字体异常检测方法。

2、为了实现上述目的,本专利技术采用了如下技术方案:

3、证件号码字体异常检测方法,包括利用正常证件号码建立单字符图像模板库、基于连通区域分析法在二值图上分割出单字符图像、字符匹配得出匹配n*m概率值,设定规则,进行规则判断,具体如下步骤:

4、s1、文本检测定位:对于待检测输入图像,通过预先训练的文本检测模型定位出该图像上所有文本条图像,基于文本识别的内容或者文本坐标提取出证件号码文本条图像;

5、s2、建立数据库:证件号码的字符集是固定的,采用字符分割方法,将正常证件号码文本图像分割成十个单字符图像,作为模板;

6、s3、图像分割:对证件号码文本条图像进行灰度处理,然后二值化处理得到二值图,对二值图进行连通区域分析,将连通区域转换为边界框,基于这些边界框在二值图上分割出已经二值化处理后的单字符图像;

7、s4、字符匹配:通过字符分割后得到多个单字符图像,将每个字符图像都与模板库中的每个字符进行模板匹配,得到n*m个匹配概率值;

8、s5、规则判断:对于n*m个匹配概率值,设置一个阈值t,分别计算n个字符的最大匹配概率值,再计算最大概率值的平均概率值m,其中n代表证件号码字符数量,m代表模板数量。

9、优选地,所述s5中假设最大概率值大于等于阈值t的字符个数为n1,则小于阈值t的字符个数为n2,其中n1+n2=n。

10、设定规则:

11、(1)若m大于等于0.9或者;

12、(2)(n1大于n2或者n2-n1小于3)并且m>0.7或者;

13、

14、(3)n1-n2大于等于2并且m>0.5;

15、则该证件号码字体正常,否则异常。

16、优选地,所述s3中将连通区域转换为边界框,将宽和高小于10 个像素的边界框过滤掉,对于剩下的边界框,如果一个框包含在另一个框里面,则将该框移除,最后留下的边界框就是各字符的位置。

17、优选地,所述s3中图像二值化处理得到二值图的方法为,提取检测证件号码文本图像,对证件号码文本图像进行二值化处理,再通过连通区域分析法及后处理得到各单字符位置,在各单字符位置上裁剪处选定的单字符。

18、优选地,所述s4中对单字符图像进行模板匹配,国内居民身份证号码18位,即n为18,m为10,印尼二代身份证号码16位,即 n为16,m为10,将每个字符图像都与模板库中的每个字符进行模板匹配。

19、相比现有技术,本专利技术的有益效果为:

20、1、本专利技术通用性强,可用于国内国外任一类型证件,便于迁移;不依赖训练学习模型,对于新增的异常字体类型,本专利技术扩展性强;执行速度快;根据证件号码位数,可得到一系列字符相似度,通过多维度多层次的规则设计,准确率高。

21、2、本专利技术基于多字符模板匹配结构,可构造多层次的判断规则,增强鲁棒性,使用连通区域分析法获得证件号码图像单字符所在位置,获得的边界框紧贴字符区域,使得裁剪出来的字符更加精准。

本文档来自技高网...

【技术保护点】

1.证件号码字体异常检测方法,其特征在于,包括利用正常证件号码建立单字符图像模板库、基于连通区域分析法在二值图上分割出单字符图像、字符匹配得出匹配N*M个概率值,设定规则,进行规则判断,具体如下步骤:

2.根据权利要求1所述的证件号码字体异常检测方法,其特征在于,所述S5中假设最大概率值大于等于阈值t的字符个数为n1,则小于阈值t的字符个数为n2,其中n1+n2=N;

3.根据权利要求1所述的证件号码字体异常检测方法,其特征在于,所述S3中将连通区域转换为边界框,将宽和高小于10个像素的边界框过滤掉,对于剩下的边界框,如果一个框包含在另一个框里面,则将该框移除,最后留下的边界框就是各字符的位置。

4.根据权利要求1所述的证件号码字体异常检测方法,其特征在于,所述S3中图像二值化处理得到二值图的方法为,提取检测证件号码文本图像,对证件号码文本图像进行二值化处理,再通过连通区域分析法及后处理得到各单字符位置,在各单字符位置上裁剪处选定的单字符。

5.根据权利要求1所述的证件号码字体异常检测方法,其特征在于,所述S4中对单字符图像进行模板匹配,国内居民身份证号码18位,即N为18,M为10,印尼二代身份证号码16位,即N为16,M为10,将每个字符图像都与模板库中的每个字符进行模板匹配。

...

【技术特征摘要】

1.证件号码字体异常检测方法,其特征在于,包括利用正常证件号码建立单字符图像模板库、基于连通区域分析法在二值图上分割出单字符图像、字符匹配得出匹配n*m个概率值,设定规则,进行规则判断,具体如下步骤:

2.根据权利要求1所述的证件号码字体异常检测方法,其特征在于,所述s5中假设最大概率值大于等于阈值t的字符个数为n1,则小于阈值t的字符个数为n2,其中n1+n2=n;

3.根据权利要求1所述的证件号码字体异常检测方法,其特征在于,所述s3中将连通区域转换为边界框,将宽和高小于10个像素的边界框过滤掉,对于剩下的边界框,如果一个框包含在另一个框里...

【专利技术属性】
技术研发人员:高利军李茜黄茹辉黄泽琪
申请(专利权)人:唯思电子商务深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1