基于OCR的文本识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：35221765 阅读：14 留言：0更新日期：2022-10-15 10:39

本发明专利技术公开了一种基于OCR的文本识别方法、装置、存储介质及电子设备，该文本识别方法包括：获取文本图像样本集、以及对应的文本标签和超分辨率图像样本；利用文本图像样本集、文本标签和超分辨率图像样本，对预先构建的文本识别网络和超分辨率网络进行训练，其中，文本识别网络包括第一损失函数，超分辨率网络包括第二损失函数，且文本识别网络和超分辨率网络包括至少一个共享的子网络；在训练过程中，根据第一损失函数和第二损失函数，对文本识别网络和超分辨率网络的网络参数进行调整；当训练完成时，利用已训练的文本识别网络进行文本识别，从而能较好地识别低质量文本图像，有效提高了文本图像的识别精准性和识别效果。提高了文本图像的识别精准性和识别效果。提高了文本图像的识别精准性和识别效果。

全部详细技术资料下载

【技术实现步骤摘要】
基于OCR的文本识别方法、装置、存储介质及电子设备
[0001]
本专利技术涉及图像处理
，具体涉及一种基于OCR的文本识别方法、装置、存储介质及电子设备。
[0002]
技术介绍
计算机视觉是一门研究如何使机器“看”的科学，更进一步的说，就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
[0003]OCR （Optical Character Recognition，光学字符识别）是计算机视觉领域的一个经典课题，并被广泛使用于无人驾驶、路标识别、车牌识别以及教育场景下的拍照搜题等领域。OCR是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。不同于电脑中的文本识别，OCR场景中需要识别的文本图像往往包含着大量低质量图像（主要指低分辨率图像），而现有的文本识别方法很难针对低质量文本图像进行有效识别，识别准确性较低。
[0004]
技术实现思路
本专利技术提出一种基于OCR的文本识别方法、装置、存储介质及电子设备，能提高文本识别的精准性，识别效果好。
[0005]一方面，本专利技术实施例提供了一种基于OCR的文本识别方法，包括：获取文本图像样本集、以及所述文本图像样本集中每张...

【技术保护点】

【技术特征摘要】
1.一种基于OCR的文本识别方法，其特征在于，包括：获取文本图像样本集、以及所述文本图像样本集中每张文本图像样本对应的文本标签和超分辨率图像样本；利用所述文本图像样本集、所述文本标签和所述超分辨率图像样本，对预先构建的文本识别网络和超分辨率网络进行训练，所述文本识别网络包括第一损失函数，所述超分辨率网络包括第二损失函数，且所述文本识别网络和所述超分辨率网络包括至少一个共享的子网络；在训练过程中，根据所述第一损失函数和所述第二损失函数，对所述文本识别网络和所述超分辨率网络的网络参数进行调整；当训练完成时，利用已训练的所述文本识别网络对待识别的文本图像进行文本识别。2.根据权利要求1所述的文本识别方法，其特征在于，所述文本识别网络包括相连接的特征提取子网络和特征识别子网络，所述超分辨率网络包括相连接的所述特征提取子网络和超分辨率子网络，所述利用所述文本图像样本集、所述文本标签和所述超分辨率图像样本，对预先构建的文本识别网络和超分辨率网络进行训练，包括：通过所述特征提取子网络，确定每张所述文本图像样本对应的特征图；通过所述超分辨率子网络，生成所述特征图对应的预测图像结果；通过所述特征识别子网络，生成所述特征图对应的预测文本结果；根据所述预测图像结果、所述预测文本结果、所述文本标签、所述超分辨率图像样本、所述第一损失函数和所述第二损失函数，对所述文本识别网络和所述超分辨率网络进行参数调整。3.根据权利要求2所述的文本识别方法，其特征在于，所述根据所述预测图像结果、所述预测文本结果、所述文本标签、所述超分辨率图像样本、所述第一损失函数和所述第二损失函数，对所述文本识别网络和所述超分辨率网络进行参数调整，包括：根据所述第一损失函数、所述预测文本结果和所述文本标签，计算第一误差值；根据所述第二损失函数、所述预测图像结果和所述超分辨率图像样本，计算第二误差值；利用公式L=L
rec +λL
sr
计算总误差值，其中，L为所述总误差值，L
rec
为所述第一误差值，L
sr
为所述第二误差值，λ为超参数；根据所述总误差值反向调整所述文本识别网络和所述超分辨率网络的网络参数。4.根据权利要求2所述的文本识别方法，其特征在于，所述特征提取子网络包括第一特征提取块、级联的多个残差块以及特征增强块，所述通过所述特征提取子网络，确定每张所述文本图像样本对应的特征图，包括：通过所述第一特征提取块，确定每张所述文本图像样本对应的第一浅层特征图；通过所述多个残差块，对所述第一浅层特征图进行处理；通过所述特征增强块，获取每个所述残差块处理后输出的残差特征图，并分别对所述第一浅层特征图和所述残差特征图进行下采样，得到对应的下采样特征图，之后对所有所述下采样特征图进行通道融合，得到所述文本图像样本对应的特征图。5.根据权利要...

【专利技术属性】
技术研发人员：柳阳，
申请(专利权)人：平安银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人