文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：34770450 阅读：28 留言：0更新日期：2022-08-31 19:30

本公开涉及一种文本识别方法、装置、存储介质及电子设备，该方法获取待检测图像对应的初始文本区域；在确定所述初始文本区域为非水平状态的情况下，对所述初始文本区域进行形变处理，得到所述初始文本区域对应的水平文本区域；根据所述水平文本区域，确定所述待检测图像中的文本。也就是说，本公开在确定待检测图像对应的初始文本区域为非水平状态的情况下，先对该初始文本区域进行形变处理，之后，再基于形变处理后的水平文本区域进行文本识别，由于该水平文本区域的形状比较规则，其轮廓不会与文本行过于贴合，使得根据该水平文本区域识别得到的文本行中的文本不会被截断，文本行更加完整，从而提高了文本识别的准确率。从而提高了文本识别的准确率。从而提高了文本识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
文本识别方法、装置、存储介质及电子设备

[0001]本公开涉及图像处理
，具体地，涉及一种文本识别方法、装置、存储介质及电子设备。

技术介绍

[0002]常见的文本识别方法可以分为印刷体识别和手写体识别，其中，手写体识别除了面临印刷体识别中的各类问题外，还受书写风格的影响。尤其在教育场景下，小学生作答时很难保证同一行内容的横平竖直，容易出现作答文本行的弧形、波浪形等多种弯曲形状，基于此，在文本行检测需求的源头产生了任意形状的文本行。
[0003]相关技术中，可以先通过神经网络预测文本行的轮廓，进而对轮廓中的文本进行识别，但是，由于文本行的形状不规则，预测出的轮廓与文本行过于贴合，导致文字容易被截断，出现文本行不完整的情况，从而使得文本识别的准确率比较低。

技术实现思路

[0004]为了解决上述问题，本公开提供一种文本识别方法、装置、存储介质及电子设备。
[0005]第一方面，本公开提供一种文本识别方法，所述方法包括：
[0006]获取待检测图像对应的初始文本区域；
[0007]在确定所述初始文本区域为非水平状态的情况下，对所述初始文本区域进行形变处理，得到所述初始文本区域对应的水平文本区域；
[0008]根据所述水平文本区域，确定所述待检测图像中的文本。
[0009]可选地，所述确定所述初始文本区域为非水平状态包括：
[0010]确定所述初始文本区域对应的最小外接矩形；
[0011]确定所述初始文本区域的区域面积与所述最小外接矩形的...

【技术保护点】

【技术特征摘要】
1.一种文本识别方法，其特征在于，所述方法包括：获取待检测图像对应的初始文本区域；在确定所述初始文本区域为非水平状态的情况下，对所述初始文本区域进行形变处理，得到所述初始文本区域对应的水平文本区域；根据所述水平文本区域，确定所述待检测图像中的文本。2.根据权利要求1所述的方法，其特征在于，所述确定所述初始文本区域为非水平状态包括：确定所述初始文本区域对应的最小外接矩形；确定所述初始文本区域的区域面积与所述最小外接矩形的矩形面积之间的面积比值；在所述面积比值小于或等于预设比值阈值的情况下，确定所述初始文本区域为非水平状态。3.根据权利要求2所述的方法，其特征在于，在所述确定所述初始文本区域对应的最小外接矩形前，所述方法还包括：针对所述初始文本区域的每个像素点，根据所述像素点的位置，确定所述像素点对应的移动方向，并根据所述移动方向和预设移动距离，确定所述像素点对应的目标位置；根据每个所述像素点对应的目标位置，确定所述初始文本区域对应的扩展文本区域；所述确定所述初始文本区域对应的最小外接矩形包括：确定所述扩展文本区域对应的最小外接矩形。4.根据权利要求1所述的方法，其特征在于，所述获取待检测图像对应的初始文本区域包括：将所述待检测图像输入预先训练的文本区域检测模型，以获取所述文本区域检测模型输出的所述初始文本区域。5.根据权利要求4所述的方法，其特征在于，所述文本区域检测模型包括特征获取子模型、特征增强子模型以及轮廓检测子模型，所述特征获取子模型的输出端与所述特征增强子模型的输入端耦合，所述特征增强子模型的输出端与所述轮廓检测子模型的输入端耦合；所述将所述待检测图像输入预先训练的文本区域检测模型，以获取所述文本区域检测模型输出的所述初始文本区域包括：将所述待检测图像输入所述特征获取子模型，以获取所述特征获取子模型输出的多个特征图，不同特征图对应的尺寸不同；将多个所述特征图输入所述特征增强子模型，通过所述特征增强子模型对多个所述特征图进行扩大增强处理和缩小增强处理，以获取所述特征增强子模型输出的多个目标特征图；根据多个所述目标特征图，通过所述轮廓检测子模型，获取所述初始文本区域。6.根据权利要求5所述的方法，其特征在于，所述根据多个所述目标特征图，通过所述轮廓检测子模型，获取所述初始文本轮廓包括：对多个所述目标特征图进行拼接处理，得到目标拼接特征图；将所述目标拼接特征图输入所述轮廓检测子模型，以获取所述轮廓检测子模型输出的所述初始文本区域。7.根据权利要求4所述的方法，其特征在于，所述文本区域检测模型通过以下方式训练
...

【专利技术属性】
技术研发人员：杨明坤，
申请(专利权)人：北京智通东方软件科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人