一种文字识别方法及装置制造方法及图纸

技术编号：25691268 阅读：48 留言：0更新日期：2020-09-18 21:02

本发明专利技术实施例提供了一种文字识别方法及装置，该方法包括：对目标图像中的像素点进行分类，获取目标图像中属于文字的像素点；提取属于文字的像素点组成的区域，并确定为文字区域；确定所述文字区域中的文字块，所述文字块为连通多个文字的区域；分别对每一个所述文字块进行畸变矫正；识别进行畸变矫正后的所述文字块中的文字。因此，本发明专利技术的方案，解决了现有技术中对图像进行文字识别的方法受制于拍照条件，往往只有部分数据能达到较好的条件，而对于畸变较大的图像中的文字往往识别效果较差甚至无法识别的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种文字识别方法及装置
本专利技术涉及数据处理
，尤其涉及一种文字识别方法及装置。
技术介绍
随着计算机视觉与深度神经网络的发展，文本识别的技术得到了极大的发展。这种技术不仅可用于身份证等证件类的识别，在票据识别中也具有广泛的应用前景。但目前在实际应用中，由于图像的采集、处理、传输等环节会存在一定程度的图像失真的问题，因此目前OCR(OpticalCharacterRecognition，光学字符识别)的应用对图片质量要求还较高，准确率还较低，不能完全达到人工的效果。因此，应用一些图像处理的手段，建立有效的图像处理技术，提高图像识别的准确性具有重大意义。近年来，图像分割与识别技术已广泛应用于各类文本的识别。OCR技术的算法，主要是依据卷积网络定位发票上的文字位置，然后通过循环神经网络等识别文字。目前的发票文字定位的方法，主要分为传统图像算法与机器学习神经网络等方法，其中，传统图像算法(如阈值分割，直线检测等)可以在内容格式相对固定，图片清晰的条件下，得到比较好的分割效果，但对于格式复杂或较模糊的图片无能为力，而神经网络算法，目前主流的有CTPN(场景文本检测)、SSD(SingleShotMultiBoxDetector，单阶段多尺度目标检测)、EAST(AnEfficientandAccurateSceneTextDetector，高效准确的场景文本检测器)等卷积神经网络框架，可以在格式复杂的发票检测中取得不错的效果，但存在着检测效果严重依赖于训练样本数据，并且目前使用较多的方法采用的是以Anchor...

【技术保护点】
1.一种文字识别方法，其特征在于，所述方法包括：/n对目标图像中的像素点进行分类，获取所述目标图像中属于文字的像素点；/n提取属于文字的像素点组成的区域，并确定为文字区域；/n确定所述文字区域中的文字块，所述文字块为连通多个文字的区域；/n分别对每一个所述文字块进行畸变矫正；/n识别进行畸变矫正后的所述文字块中的文字。/n

【技术特征摘要】
1.一种文字识别方法，其特征在于，所述方法包括：
对目标图像中的像素点进行分类，获取所述目标图像中属于文字的像素点；
提取属于文字的像素点组成的区域，并确定为文字区域；
确定所述文字区域中的文字块，所述文字块为连通多个文字的区域；
分别对每一个所述文字块进行畸变矫正；
识别进行畸变矫正后的所述文字块中的文字。

2.根据权利要求1所述的文字识别方法，其特征在于，所述对目标图像中的像素点进行分类，获取所述目标图像中属于文字的像素点，包括：
利用预先建立的用于区分图片的像素点为文字和非文字的卷积神经网络对所述目标图像进行处理，获得目标概率矩阵，所述目标概率矩阵中的取值表示所述目标图像中的像素点属于文字的概率；
根据所述目标概率矩阵，获取所述目标图像中属于文字的像素点。

3.根据权利要求2所述的文字识别方法，其特征在于，所述卷积神经网络通过如下过程建立：
获取多个样本图片的标签矩阵，所述标签矩阵中的取值表示所述样本图片的像素是否属于文字；
采用预先确定的卷积神经网络的第一卷积参数，对第一样本图片进行处理，获得第一预测概率矩阵，所述第一预测概率矩阵中的取值表示所述第一样本图片中的像素点属于文字的概率；
采用梯度下降法获得所述第一预测概率矩阵与所述第一样本图片的标签矩阵的误差处于预设范围内时，所述卷积神经网络的第二卷积参数；
采用所述卷积神经网络的第二卷积参数，对第二样本图片进行处理，直到所述多个样本图片均处理完毕时，将最后一次利用所述卷积神经网络进行处理后获得的卷积参数，确定为所述卷积神经网络的目标卷积参数。

4.根据权利要求3所述的文字识别方法，其特征在于，所述采用预先确定的卷积神经网络的第一卷积参数，对第一样本图片进行处理，获得第一预测概率矩阵，包括：
采用预先确定的卷积神经网络的卷积参数，提取所述第一样本图片不同尺度的特征，并进行特征融合输出，获得目标矩阵，所述目标矩阵包括多个通道；
将所述目标矩阵的最后一个通道的矩阵确定为目标输出矩阵；
对所述目标输出矩阵进行全连接输出处理，并进行逻辑回归运算，获得所述第一预测概率矩阵。

5.根据权利要求2所述的文字识别方...

【专利技术属性】
技术研发人员：张秋晖，刘岩，丁笑天，朱兴杰，
申请(专利权)人：泰康保险集团股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人