一种手写汉字身份鉴别方法及系统技术方案

技术编号:30902301 阅读:22 留言:0更新日期:2021-11-22 23:46
本发明专利技术提出了一种手写汉字身份鉴别方法及系统,包括:获取用于手写汉字身份鉴别的比对图像,对比对图像进行处理,获得一批多尺度描述图像;将处理后的比对图像用于神经网络判定模型训练,获得训练后的神经网络判定模型;训练的过程中,将静态的多尺度描述图像进行有重叠的小块划分,构建出二维空间里横向和纵向两个方向上小块图像间的关联关系,将上述多个子结果分别拉成一维向量后进行融合,融合的结果通过多个全连接层操作,最后映射为类别标签;对待检材样本进行图像处理并将处理后的图像利用训练后的神经网络判定模型类别标签进行识别,预测的手写字图像对应的身份标签。预测的手写字图像对应的身份标签。预测的手写字图像对应的身份标签。

【技术实现步骤摘要】
一种手写汉字身份鉴别方法及系统


[0001]本专利技术属于手写汉字鉴别
,尤其涉及一种手写汉字身份鉴别方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]司法鉴定领域中笔迹鉴定是根据人的书写技能习惯特征、在书写的字迹与绘画中的反映,来鉴别书写人的专门技术。主要任务是通过笔迹的同一认定检验,证明文件物证上的笔迹是否为同一人的笔迹,证明文件物证上的笔迹是否为某嫌疑人的笔迹。
[0004]现有技术中,采用人工提取或者汉字分割自动化实现,具体为:
[0005]人工提取样本文书的笔迹特征,需要非常专业的笔迹鉴定专家。
[0006]自动化的方法,汉字分割,提取笔迹专家手工设计的特征,如笔画流畅程度,某种笔画(如横笔画)的倾斜方向和角度、笔画间结构关系,带有连笔的笔画间的笔顺关系等。
[0007]存在的问题是:
[0008]1、人工提取样本文书的笔迹特征,耗时费力,培养专业的笔迹鉴定专家一般需要多年的学习及实务训练。
[0009]2、汉字分割,即从书写的材料转化成的电子图像文件中,先把汉字识别出来,由于汉字本身的结构复杂性,不同的人书写习惯等,手写汉字大小、结构、偏旁部首间的位置关系等均比较复杂,汉字分割本身是自动处理过程中的难题,非常容易出错,计算速度慢,给后续处理工作带来障碍。
[0010]另外,现有自动化方法直接处理整幅样本图像,计算量大,运行速度慢。样本大都来自A4大小纸张扫描得到,扫描分辨率在500DPI到1200DPI左右。也就意味着图像大小为4135*5875像素(500DPI)甚至9924*14100像素大小。
[0011]还有,存在自动化方法把样本图像裁剪成不重叠的小块图像,虽然避免了上述直接处理整幅样本图像中描述的问题,但是图像块之间的关系被忽略,相当于整幅样本图像的宏观特征被忽略,导致鉴别效果受到限制。

技术实现思路

[0012]为克服上述现有技术的不足,本专利技术提供了一种手写汉字身份鉴别方法,用于完成笔迹身份鉴别。
[0013]为实现上述目的,本专利技术的一个或多个实施例提供了如下技术方案:
[0014]第一方面,公开了一种手写汉字身份鉴别方法,包括:
[0015]获取用于手写汉字身份鉴别的比对图像,对比对图像进行处理,获得一批多尺度描述图像;
[0016]将处理后的比对图像用于神经网络判定模型训练,获得训练后的神经网络判定模
型;
[0017]训练的过程中,将静态的多尺度描述图像进行有重叠的小块划分,构建出二维空间里横向和纵向两个方向上小块图像间的关联关系,将上述多个子结果分别拉成一维向量后进行融合,融合的结果通过多个全连接层操作,最后映射为类别标签;
[0018]对待检材样本进行图像处理并将处理后的图像利用训练后的神经网络判定模型类别标签进行识别,预测的手写字图像对应的身份标签。
[0019]进一步的技术方案,比对图像中划分多组,每组比对样本为手写笔迹扫描图,处理时包括图像去噪、多尺度分块、多尺度块预处理、大块图像处理、中块图像处理及小块图像笔画分割。
[0020]进一步的技术方案,针对比对图像裁剪出像素、分辨率与原图相同的ROI区域,裁剪后的图像为第一图像;
[0021]优选的,裁剪过程包含尽量多的有效文字区域。
[0022]进一步的技术方案,针对裁剪后的第一图像再次裁剪,确保再次裁剪后的图像无大块的空白区域;
[0023]再次裁剪后的图像进行前景与背景的分割;
[0024]分割后的图像进行形态画操作,填补汉字内部的空间,使得图像压缩后依然保留宏观书写习惯的信息;
[0025]最后进行尺寸压缩,获得第一子图。
[0026]进一步的技术方案,针对裁剪后的第一图像进行无重叠分割,得到多幅图像,针对每一幅图像进行前景与背景的分割;
[0027]对笔画域进行形态学操作,保留笔画同时保留笔画周边的小的邻域;
[0028]通过阈值判断将不满足字数要求的图像过滤掉;
[0029]将二值图作为掩模,与第一图像进行无重叠分割后的图像对每个对应像素进行点乘操作,获得一个灰度图,为第二子图。
[0030]进一步的技术方案,针对裁剪后的第一图像进行有重叠的裁剪,对于每一行的块,每次裁剪后向右平移设定值像素后继续裁剪,裁剪完一行后,向下平移设定值像素后继续裁剪;
[0031]继续裁剪获得图像进行前背景的分割、形态学腐蚀、是否无笔画块的阈值判断以及将掩模用于灰度图像的笔画分割,获得第三子图。
[0032]进一步的技术方案,训练过程将若干手写字不同尺度的图片信息输入模型,同时将对应的手写身份标签输入,对模型进行迭代训练。
[0033]第二方面,公开了一种手写汉字身份鉴别系统,包括:
[0034]比对图像处理模块,被配置为:获取用于手写汉字身份鉴别的比对图像,对比对图像进行处理,获得一批多尺度描述图像;
[0035]模型训练模块,被配置为:将处理后的比对图像用于神经网络判定模型训练,获得训练后的神经网络判定模型;
[0036]训练的过程中,将静态的多尺度描述图像进行有重叠的小块划分,构建出二维空间里横向和纵向两个方向上小块图像间的关联关系,将上述多个子结果分别拉成一维向量后进行融合,融合的结果通过多个全连接层操作,最后映射为类别标签;
[0037]手写字图像预测模块,被配置为:对待检材样本进行图像处理并将处理后的图像利用训练后的神经网络判定模型类别标签进行识别,预测的手写字图像对应的身份标签。
[0038]以上一个或多个技术方案存在以下有益效果:
[0039]本专利技术主要针对笔迹鉴定业务中正常笔迹的辅助身份识别。即检材为书写人某种笔(签字笔、钢笔、圆珠笔)的书写笔迹,与源自多人的笔迹比对样本进行相似性比较。该方法的基本思路是,把笔迹作为一种纹理线条,从图像处理的角度,用机器学习方法分析样本之间的相似度,进而给出类别估计的概率。
[0040]本专利技术结合图像处理技术+前沿深度学习技术,把笔迹看作笔画的纹理图像,分析这种特殊图像的行笔书写特点与书写人的对应关系,独立于汉字,无须进行汉字的识别分割,不需要了解掌握太多笔迹身份识别的领域知识。
[0041]本专利技术对大幅图像进行分块处理,然后使用轻量级神经网络结构,提高处理速度。轻量级卷积神经网络,适合移动式设备、机器人等进行本地计算。虽然本专利技术提出的模型看起来结构略微复杂,但是一方面,卷积神经网络模型实际处理的大部分数据都是小尺寸图像;另一方面,卷积神经网络的参数规模都非常小远小于经典网络结构如VGG等网络,并且,当硬件设备支持的情况下,本模型可以通过一定程度并行计算来完成,进一步优化计算。
[0042]本专利技术多尺度综合特征,充分考虑书写时篇幅、行距、等特征,当然也包含笔画汉字结构特征,处理框架上模仿人类视觉特点,先粗略浏览宏观的全本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种手写汉字身份鉴别方法,其特征是,包括:获取用于手写汉字身份鉴别的比对图像,对比对图像进行处理,获得一批多尺度描述图像;将处理后的比对图像用于神经网络判定模型训练,获得训练后的神经网络判定模型;训练的过程中,将静态的多尺度描述图像进行有重叠的小块划分,构建出二维空间里横向和纵向两个方向上小块图像间的关联关系,将上述多个子结果分别拉成一维向量后进行融合,融合的结果通过多个全连接层操作,最后映射为类别标签;对待检材样本进行图像处理并将处理后的图像利用训练后的神经网络判定模型类别标签进行识别,预测的手写字图像对应的身份标签。2.如权利要求1所述的一种手写汉字身份鉴别方法,其特征是,比对图像中划分多组,每组比对样本为手写笔迹扫描图,处理时包括图像去噪、多尺度分块、多尺度块预处理、大块图像处理、中块图像处理及小块图像笔画分割。3.如权利要求1所述的一种手写汉字身份鉴别方法,其特征是,针对比对图像裁剪出像素、分辨率与原图相同的ROI区域,裁剪后的图像为第一图像;优选的,裁剪过程包含尽量多的有效文字区域。4.如权利要求3所述的一种手写汉字身份鉴别方法,其特征是,针对裁剪后的第一图像再次裁剪,确保再次裁剪后的图像无大块的空白区域;再次裁剪后的图像进行前景与背景的分割;分割后的图像进行形态画操作,填补汉字内部的空间,使得图像压缩后依然保留宏观书写习惯的信息;最后进行尺寸压缩,获得第一子图。5.如权利要求3所述的一种手写汉字身份鉴别方法,其特征是,针对裁剪后的第一图像进行无重叠分割,得到多幅图像,针对每一幅图像进行前景与背景的分割;对笔画域进行形态学操作,保留笔画同时保留笔画周边的小的邻域;通过阈值判断将不满足字数要求的图像过滤掉;将二值图作为掩模,与第一图像进行无重叠分割后的图像对每个...

【专利技术属性】
技术研发人员:郝凡昌尹义龙庞先昂张浩杨璐聂秀山孙振行乔文静陈勐孙皓亮袭肖明魏珑
申请(专利权)人:山东博昂信息科技有限公司山东大学
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1