一种基于融合检测的底稿图像识别系统及方法技术方案

技术编号：42958642 阅读：30 留言：0更新日期：2024-10-11 16:17

本发明专利技术公开了一种基于融合检测的底稿图像识别系统及方法，属于光学字符识别技术领域，其方法具体包括：获取底稿图像，并对获取的底稿图像进行预处理，对预处理后的底稿图像进行角度识别，并进行旋转校正处理，对旋转校正后的底稿图像中的文本位置进行识别，根本识别出的底稿图像中的文本位置，对底稿图像中文本内容进行识别，通过融合多种检测方法，可以综合各自的优点，减少单一方法的缺陷，提高底稿图像的识别精度，该方法适用于各种复杂的底稿图像识别场景，包括但不限于金融领域的底稿图像等。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于光学字符识别，具体的说是一种基于融合检测的底稿图像识别系统及方法。

技术介绍

1、光学字符识别一般包括图像预处理、文本检测和文本识别过程，其中文本检测方法中比较流行的是基于像素分割的方法和基于回归的方法。底稿图像包含金融场景下的各类文本图像，如银行流水、发票、凭证和各类证件照等，打印质量也各不相同，存在拍照、扫描和pdf打印等。因此，底稿图像中的文本行尺寸、形状和页面排版多变，字体也各不相同，存在小字、透字、文本粘连等问题，由于其场景的复杂性，使用现有的单一文本检测模型很难达到较好的文本检测效果，从而导致整体识别质量差。

2、基于像素分割的文本检测方法通常借鉴物体语义分割和实例分割的思想，利用全卷积神经网络对图像中的每个像素点进行文本和非文本分类，从而得到文本区域掩码图，然后通过一些像素聚合的后处理方式将属于同一文本的文本像素点聚合在一起得到最后的文本实例边界框，这类方法中比较典型的算法有psenet、pan、msr和dbnet等。基于回归的文本检测方法主要是基于以深度学习为基础的目标检测技术或者实例分割技术，...

【技术保护点】

1.一种基于融合检测的底稿图像识别方法，其特征在于，包括：

2.如权利要求1所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述对预处理后的底稿图像进行角度识别，包括：

3.如权利要求2所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述提取底稿图像I(x,y)的倾斜角度，包括：

4.如权利要求3所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述旋转校正处理，包括：

5.如权利要求4所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述对旋转校正后的金融领域的底稿图像中的文本位置进行识别，包括：</p>

6.如权...

【技术特征摘要】

1.一种基于融合检测的底稿图像识别方法，其特征在于，包括：

2.如权利要求1所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述对预处理后的底稿图像进行角度识别，包括：

3.如权利要求2所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述提取底稿图像i(x,y)的倾斜角度，包括：

4.如权利要求3所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述旋转校正处理，包括：

5.如权利要求4所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述对旋转校正后的金融领域的底稿图像中的文本位置进行识别，包括：

6.如权利要求5所述的一种基于融合检测的底稿图像识别方法，其特征在于，所述融合策略，包括：

【专利技术属性】
技术研发人员：尹亮，刘辉，邓勇，仇星，韩起磊，
申请(专利权)人：北京荣大科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人