一种印章文字的识别方法以及系统技术方案

技术编号：32785149 阅读：14 留言：0更新日期：2022-03-23 19:44

本发明专利技术提供了一种印章文字的识别方法以及系统，所述识别方法包括：对印章检测得到印章切片图像，依次进行分类预测、去噪、文字检测以及文字识别的步骤，然后输出文字识别结果；对检测得到的印章切片图像进行特征提取得到特征向量，与印章底库进行相似度计算后输出匹配结果信息TopN，最后将匹配结果TopN与文字识别结果进行相似度计算，根据逻辑判断输出最终的印章文字信息。本发明专利技术的识别方法提出了一套印章文字识别的流程，结合图片特征模板匹配与文字识别实现印章文字的精确识别。文字识别实现印章文字的精确识别。文字识别实现印章文字的精确识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种印章文字的识别方法以及系统

[0001]本专利技术涉及印章文字处理领域，具体而言，涉及一种印章文字的识别方法以及系统。

技术介绍

[0002]印章作为一种标记信物，在各级国家部门、组织机构以及企事业单中有着举足轻重的地位。尤其是在金融公司、银行和政府事业单位中，印章使用的次数最为频繁，而与之对应的带有印章的文件也就更为多种多样且数量巨大，随之而来的识别处理带有印章的文件所需要的人力也就愈加庞大，这使得相关工作人员工作效率大大降低。随着图像处理技术发展，光学字符识别(Optical Character Recognition,OCR)等技术也取得了巨大的发展，OCR技术能对文本资料的图像文件进行分析识别处理，获取文字及版面信息，即将图像中的文字进行识别，并以文本的形式返回。同时随着电子化与无纸化办公的进一步普及，印章电子化也成为一种趋势。如果能够使用图像处理与光学字符识别的相关技术对中文印章内的文字进行检测与识别，使用机器快速地对印章的内容进行检测与分类，可以有效地提高文档分类的效率与准确率，节省人力，具有巨大的应用价值。
[0003]现有技术中的印章文字识别的难点在于：(1)文档中盖章的背景多种多样，这些噪声对印章上的文字识别造成很大干扰；(2)印章样式多样，对不同样式印章的文字识别是一个难点。
[0004]有鉴于此，特提出本专利技术。

技术实现思路

[0005]有鉴于此，本专利技术公开了一种印章文字的识别方法以及系统，该识别方法提出了一套印章文字识别的流程，结合图片特征模板匹配与...

【技术保护点】

【技术特征摘要】
1.一种印章文字的识别方法，其特征在于，包括如下步骤：对印章检测得到印章切片图像，依次进行分类预测、去噪、文字检测以及文字识别的步骤，然后输出文字识别结果；对检测得到的印章切片图像进行特征提取得到特征向量，与印章底库进行相似度计算后输出匹配结果信息TopN。2.根据权利要求1所述的印章文字的识别方法，其特征在于，与印章底库进行相似度计算的方法包括：若存在TopN分数大于Thr1，则将符合该阈值的标签列表与所述文字识别结果进行相似度计算，否则输出文字识别结果；将符合阈值的n个标签与所述文字识别结果计算最小编辑距离，排序获得n个相似度分数CTopN，若存在CTopN分数大于Thr2，则输出CTopN中的CTop1的标签信息，否则输出文字识别结果。3.根据权利要求1所述的印章文字的识别方法，其特征在于，特征提取的过程中先对特征提取模型进行训练，训练的基本网络结构采用孪生网络，并使用triple loss进行训练参数调整。4.根据权利要求1所述的印章文字的识别方法，其特征在于，所述分类预测采用VGG16二分类网络模型进行。...

【专利技术属性】
技术研发人员：王琦琦，陈鸣，姬晴晴，
申请(专利权)人：金科览智科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人