印章文字识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:28376066 阅读:44 留言:0更新日期:2021-05-08 00:03
本申请涉及一种印章文字识别方法、装置、计算机设备和存储介质。所述方法包括:检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;对所述印章图像进行背景消除,得到背景消除印章图像;在所述背景消除印章图像中定位环形排版文字图像;对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;对所述直条排版文字图像进行文字识别,获得印章文字。采用本方法能够提高印章文字识别的准确率。

【技术实现步骤摘要】
印章文字识别方法、装置、计算机设备和存储介质
本申请涉及计算机
,特别是涉及一种印章文字识别方法、装置、计算机设备和存储介质。
技术介绍
随着计算机技术的发展,通过机器检测并识别图像中的目标对象的技术,得到了广泛的使用。目前,通过机器检测并识别图像中的印章,通常是通过预留的印章图像去匹配出图像中的印章,对匹配出的印章的文字区域进行分割,对分割后的文字区域进行文字识别,以识别出印章的文字。然而,通过预留的印章图像去匹配出图像中的印章,若是图像中的印章出现了改变,那么就无法和预留的印章图像进行匹配。而且,直接对分割后的印章的文字区域进行文字识别,若是因拍摄角度问题造成印章文字区域的文字形变而分割不准确或是有背景干扰在印章文字区域上,则会导致文字识别有误。因此,目前的印章文字识别方法的准确率不高。
技术实现思路
基于此,有必要针对上述技术问题,提供一种能够提高准确率的印章文字识别方法、装置、计算机设备和存储介质。一种印章文字识别方法,所述方法包括:检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;对所述印章图像进行背景消除,得到背景消除印章图像;在所述背景消除印章图像中定位环形排版文字图像;对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;对所述直条排版文字图像进行文字识别,获得印章文字。在其中一个实施例中,所述印章图像是通过印章检测模型检测到的;所述印章检测模型是通过印章检测模型训练步骤训练得到的,所述印章检测模型训练步骤包括:获取样本图像以及标注所述样本图像中印章位置的样本印章位置数据;将所述样本图像调整至预设尺寸,将调整后的样本图像输入至待训练的印章检测模型,得到至少一个中间预测位置数据;基于所述中间预测位置数据和所述样本印章位置数据的差异,调整所述印章检测模型的参数,使得所述印章检测模型预测的中间预测位置数据朝所述样本印章位置数据收敛,并继续训练,直至满足第一训练停止条件时停止训练,获得经过训练的印章检测模型。在其中一个实施例中,所述背景消除印章图像是通过印章背景消除模型生成的;所述印章背景消除模型是通过印章背景消除模型训练步骤训练得到的,所述印章背景消除模型训练步骤包括:获取样本印章图像以及模板图像,所述模板图像标记有所述样本印章图像中的文字区域和非文字区域;根据所述模板图像,调整待训练的印章背景消除模型的参数,使得所述印章背景消除模型针对所述样本印章图像的文字区域消除背景,得到中间背景消除印章图像;基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛,并继续训练,直至满足第二训练停止条件时停止训练,获得经过训练的印章背景消除模型。在其中一个实施例中,所述基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛,并继续训练,直至满足第二训练停止条件时停止训练,获得经过训练的印章背景消除模型,包括:基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛;当所述像素点差异收敛到所述预期差异范围时,获取将所述样本印章图像输入至收敛后的印章背景消除模型所得到的消除背景的中间印章图像;分别将所述中间印章图像和所述背景消除标注图像输入至印章判别模型进行判别;当所述中间印章图像和所述背景消除标注图像均判定为真时停止训练,否则继续训练。在其中一个实施例中,所述对所述环形排版文字图像进行拉直处理,得到直条排版文字图像,包括:校正所述环形排版文字图像的朝向,使得校正后的所述环形排版文字图像与待映射的矩形图像方向匹配;确定校正后的环形排版文字图像映射到对应的矩形图像中的坐标;按照所述坐标,将所述校正后的环形排版文字图像中的像素映射到所述矩形图像中,得到直条排版文字图像。在其中一个实施例中,所述印章文字是通过印章文字模型识别到的;所述印章文字模型是通过印章文字模型训练步骤训练得到的,所述印章文字模型训练步骤包括:获取样本直条排版文字图像;通过经过训练的印章文字模型,对所述样本直条排版文字图像进行文字识别,得到中间文字;获取对所述中间文字纠正后获得的纠正文字;基于所述样本直条排版文字图像和对应的纠正文字,对所述经过训练的印章文字模型进行再训练,直至满足第三训练停止条件时停止训练。在其中一个实施例中,所述校正所述环形排版文字图像的朝向,使得校正后的所述环形排版文字图像与待映射的矩形图像方向匹配,包括:获取所述环形排版文字图像与待映射的矩形图像之间的方向偏角;以所述环形排版文字图像的圆心点位置为固定点,根据所述方向偏角调整所述环形排版文字图像的朝向,使得经过调整的环形排版文字图像与所述待映射的矩形图像之间的方向偏角在预设偏差范围内。一种印章文字识别装置,所述装置包括:检测模块,用于检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;消除模块,用于对所述印章图像进行背景消除,得到背景消除印章图像;拉直模块,用于在所述背景消除印章图像中定位环形排版文字图像;对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;识别模块,用于对所述直条排版文字图像进行文字识别,获得印章文字。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;对所述印章图像进行背景消除,得到背景消除印章图像;在所述背景消除印章图像中定位环形排版文字图像;对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;识别模块,用于对所述直条排版文字图像进行文字识别,获得印章文字。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;对所述印章图像进行背景消除,得到背景消除印章图像;在所述背景消除印章图像中定位环形排版文字图像;对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;识别模块,用于对所述直条排版文字图像进行文字识别,获得印章文字。上述印章文字识别方法、装置、计算机设备和存储介质,首先对目标图像中的印章图像进行检测,并直接截取出印章图像,无需通过预留的印章图像去匹配,避免了印章图像因为拍摄角度或者印章发生了修改而无法与预留的印章图像匹配,最终导致无法截取出印章图像。对截取出的印章图像进行背景消除后,再将印章图像的环形排版文字图像提取并进行拉直本文档来自技高网...

【技术保护点】
1.一种印章文字识别方法,其特征在于,所述方法包括:/n检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;/n对所述印章图像进行背景消除,得到背景消除印章图像;/n在所述背景消除印章图像中定位环形排版文字图像;/n对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;/n对所述直条排版文字图像进行文字识别,获得印章文字。/n

【技术特征摘要】
1.一种印章文字识别方法,其特征在于,所述方法包括:
检测目标图像中的印章图像,并从所述目标图像中截取出所述印章图像;
对所述印章图像进行背景消除,得到背景消除印章图像;
在所述背景消除印章图像中定位环形排版文字图像;
对所述环形排版文字图像进行拉直处理,得到直条排版文字图像;
对所述直条排版文字图像进行文字识别,获得印章文字。


2.根据权利要求1所述的方法,其特征在于,所述印章图像是通过印章检测模型检测到的;所述印章检测模型是通过印章检测模型训练步骤训练得到的,所述印章检测模型训练步骤包括:
获取样本图像以及标注所述样本图像中印章位置的样本印章位置数据;
将所述样本图像调整至预设尺寸,将调整后的样本图像输入至待训练的印章检测模型,得到至少一个中间预测位置数据;
基于所述中间预测位置数据和所述样本印章位置数据的差异,调整所述印章检测模型的参数,使得所述印章检测模型预测的中间预测位置数据朝所述样本印章位置数据收敛,并继续训练,直至满足第一训练停止条件时停止训练,获得经过训练的印章检测模型。


3.根据权利要求1所述的方法,其特征在于,所述背景消除印章图像是通过印章背景消除模型生成的;所述印章背景消除模型是通过印章背景消除模型训练步骤训练得到的,所述印章背景消除模型训练步骤包括:
获取样本印章图像以及模板图像,所述模板图像标记有所述样本印章图像中的文字区域和非文字区域;
根据所述模板图像,调整待训练的印章背景消除模型的参数,使得所述印章背景消除模型针对所述样本印章图像的文字区域消除背景,得到中间背景消除印章图像;
基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛,并继续训练,直至满足第二训练停止条件时停止训练,获得经过训练的印章背景消除模型。


4.根据权利要求3所述的方法,其特征在于,所述基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛,并继续训练,直至满足第二训练停止条件时停止训练,获得经过训练的印章背景消除模型,包括:
基于所述中间背景消除印章图像与所述样本印章图像对应的背景消除标注图像之间的像素点差异,调整所述印章背景消除模型的参数,使得所述像素点差异朝预期差异范围收敛;
当所述像素点差异收敛到所述预期差异范围时,获取将所述样本印章图像输入至收敛后的印章背景消除模型所得到的消除...

【专利技术属性】
技术研发人员:许康宁可蒋菲罗春桉
申请(专利权)人:金蝶软件中国有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1