文字识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：34850427 阅读：10 留言：0更新日期：2022-09-08 07:50

本公开实施例公开了一种文字识别方法、装置、电子设备及存储介质。该方法包括：接收待文字识别图像；基于区域识别模型确定与待文字识别图像相对应的目标文字区域，并基于文字识别模型确定目标文字区域所对应的目标文字；其中，区域识别模型和文字识别模型为对基准模型进行轻量化优化后所对应的模型；显示与待文字识别图像相对应的目标文字。基于上述技术方案，将对基准模型进行轻量化优化后所对应的区域识别模型和文字识别模型部署在移动端，达到了将文字识别方法部署在终端设备中，并且实现了对准确率影响较小的同时提高应用实时性能的技术效果。的技术效果。的技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法、装置、电子设备及存储介质

[0001]本公开实施例涉及图像处理
，尤其涉及一种文字识别方法、装置、电子设备及存储介质。

技术介绍

[0002]随着图像处理技术的不断发展，用户可以利用多种应用对图像进行文字识别，从而达到从图像中提取文字信息的目的。
[0003]现有的文字识别方法往往是直接将得到的模型进行简化后部署在移动端，仅仅考虑网络结构轻量化或模型压缩等单一角度，无法保证识别结果的准确性，不能满足用户的需求。

技术实现思路

[0004]本公开实施例提供一种文字识别方法、装置、电子设备及存储介质，以实现将文字识别方法部署在终端设备中，达到了对准确率影响较小的同时提高应用实时性能的技术效果。
[0005]第一方面，本公开实施例提供了一种文字识别方法，该方法包括：
[0006]接收待文字识别图像；
[0007]基于区域识别模型确定与所述待文字识别图像相对应的目标文字区域，并基于文字识别模型确定所述目标文字区域所对应的目标文字；其中，所述区域识别模型和所述文字识别模型为对基准模型进行轻量化优化后所对应的模型；
[0008]显示与所述待文字识别图像相对应的目标文字。
[0009]第二方面，本公开实施例还提供了一种文字识别装置，该装置包括：
[0010]图像接收模块，用于接收待文字识别图像；
[0011]文字识别模块，用于基于区域识别模型确定与所述待文字识别图像相对应的目标文字区域，并基于文字识别模型确定所述目标文字区域所对应的...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法，其特征在于，应用于客户端中，包括：接收待文字识别图像；基于区域识别模型确定与所述待文字识别图像相对应的目标文字区域，并基于文字识别模型确定所述目标文字区域所对应的目标文字；其中，所述区域识别模型和所述文字识别模型为对基准模型进行轻量化优化后所对应的模型；显示与所述待文字识别图像相对应的目标文字。2.根据权利要求1所述的方法，其特征在于，所述基于区域识别模型确定与所述待文字识别图像相对应的目标文字区域，并基于文字识别模型确定所述目标文字区域所对应的目标文字，包括：基于所述区域识别模型对待文字识别图像进行处理，得到与所述待文字识别图像相对应的目标矩阵，并基于所述目标矩阵确定所述目标文字区域；基于所述文字识别模型对所述目标文字区域以及所述待文字识别图像进行处理，确定与所述目标文字区域相对应的目标文字。3.根据权利要求2所述的方法，其特征在于，所述基于所述目标矩阵确定所述目标文字区域，包括：基于所述目标矩阵，确定文字信息于所述待文字识别图像中所对应的目标像素点；基于预设形状和所述目标像素点，确定所述目标文字区域。4.根据权利要求1所述的方法，其特征在于，还包括：获取至少一个第一训练样本；其中，所述第一训练样本中包括第一原始图像，以及第一原始图像中文字区域所对应的坐标矩阵；针对各训练样本，将当前训练样本中的第一原始图像以及相应的坐标矩阵输入至待训练区域识别模型中，得到与所述当前训练样本相对应的实际输出矩阵；其中，所述待训练区域识别模型中的通道数量为第一预设通道数量；基于所述实际输出矩阵和所述坐标矩阵，确定损失值，以基于所述损失值对所述待训练区域识别模型中的模型参数进行修正；将所述待训练区域识别模型中的损失函数收敛作为训练目标，得到所述区域识别模型。5.根据权利要求4所述的方法，其特征在于，还包括：获取至少一个第二训练样本；其中，所述第二训练样本中包...

【专利技术属性】
技术研发人员：王玲玲，普恒安，李丽，
申请(专利权)人：中邮信息科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人