文字识别方法、系统及存储介质技术方案

技术编号：28538363 阅读：21 留言：0更新日期：2021-05-21 09:02

本申请公开了一种文字识别方法、系统及存储介质，涉及文字识别技术。具体方案包括：控制端将获取的待识别图像发送给云服务端的计算设备；待识别图像中包含至少一个待识别的文字信息；控制端获取计算设备确定的待识别图像中包含文字信息的至少一个待识别区域；控制端根据每个待识别区域，分别确定对应的子图像，并将每个子图像发送给计算设备；子图像为待识别区域中包含的待识别图像；控制端获取计算设备从每个子图像中分别确定的文字信息。本申请可以在满足对待识别图像中的文字信息的识别精度要求的基础上，降低文字信息识别所需的计算资源成本和时间成本。

全部详细技术资料下载

【技术实现步骤摘要】
文字识别方法、系统及存储介质
本申请涉及文字识别技术，特别是涉及一种文字识别方法、系统及存储介质。
技术介绍
随着互联网技术的发展，从图像中识别文字信息的文字识别技术有着越来越广泛的应用领域，可以广泛应用于对文档图像、车牌、广告、菜单等图像中的文字信息进行识别。现有技术中通常可以采用版面分析或深度学习的方法进行图像中的文字识别。然而，版面分析的方法需要待识别图像的版面结构有较强的规则性，且图像中包含文字信息的前景部分和包含其他图像信息的背景部分可区分性强，无法适应图像的前景部分和背景部分复杂、版面结构随意的待识别图像。而深度学习的方法进行图像处理，在处理复杂待识别图像时计算量很大。无论采用现有技术中何种方法进行文字识别，均难以满足实际使用时的识别需求，尤其当字体变化丰富、背景部分对前景部分干扰较大时，要么难以满足识别精度要求，要么耗费的计算资源成本和时间成本过大，难以承受。
技术实现思路
有鉴于此，本申请的主要目的在于提供一种文字识别方法，该方法可以克服现有技术的缺陷，在满足对待识别图像中的文字信息的识别精度要求的基础上，降低文字信息识别所需的计算资源成本和时间成本。为了达到上述目的，本申请提出的技术方案为：第一方面，本申请实施例提供了一种文字识别方法，包括以下步骤：控制端将获取的待识别图像发送给云服务端的计算设备；所述待识别图像中包含至少一个待识别的文字信息；所述控制端获取所述计算设备确定的所述待识别图像中包含所述文字信息的至少一个待识别区域；所述...

【技术保护点】
1.一种文字识别方法，其特征在于，包括：/n控制端将获取的待识别图像发送给云服务端的计算设备；所述待识别图像中包含至少一个待识别的文字信息；/n所述控制端获取所述计算设备确定的所述待识别图像中包含所述文字信息的至少一个待识别区域；/n所述控制端根据每个所述待识别区域，分别确定对应的子图像，并将每个所述子图像发送给所述计算设备；所述子图像为所述待识别图像包含于所述待识别区域中的部分；/n所述控制端获取所述计算设备从每个所述子图像中分别确定的所述文字信息。/n

【技术特征摘要】
1.一种文字识别方法，其特征在于，包括：
控制端将获取的待识别图像发送给云服务端的计算设备；所述待识别图像中包含至少一个待识别的文字信息；
所述控制端获取所述计算设备确定的所述待识别图像中包含所述文字信息的至少一个待识别区域；
所述控制端根据每个所述待识别区域，分别确定对应的子图像，并将每个所述子图像发送给所述计算设备；所述子图像为所述待识别图像包含于所述待识别区域中的部分；
所述控制端获取所述计算设备从每个所述子图像中分别确定的所述文字信息。

2.根据权利要求1所述的方法，其特征在于，所述方法还包括，所述云服务端的计算设备采用下述步骤调度：
每隔预设时间间隔，所述控制端获取所述云服务端提供的每个计算设备确定所述待识别区域和所述文字信息的总负载；
在所述总负载大于预设的第一负载阈值的情况下，所述控制端向所述云服务端申请分配预定数量个所述计算设备；
在所述总负载小于预设的第二负载阈值的情况下，所述控制端向所述云服务端申请释放预定数量个所述计算设备。

3.根据权利要求2所述的方法，其特征在于，所述总负载为所述云服务端提供的每个计算设备确定所述待识别区域和所述文字信息的总时间。

4.根据权利要求1所述的方法，其特征在于，所述方法还包括，所述云服务端的计算设备采用下述步骤调度：
当所述控制端获取所述待识别图像时，向所述云服务端申请分配至少一个所述计算设备，将获取的待识别图像和每个所述子图像发送给分配的所述计算设备；
当所述控制端获取所述计算设备确定的所述文字信息时，向所述云服务端申请释放所述至少一个计算设备。

5.根据权利要求1所述的方法，其特征在于，所述待识别区域为平行四边形区域；
所述控制端根据每个所述待识别区域，分别确定对应的子图像的步骤包括：
针对每个所述待识别区域，确定对应待识别区域的中间图像；所述中间图像为平行四边形；
对所述中间图像进行旋转拉伸，得到所述子图像；所述子图像为矩形。

6.根据权利要求1所述的方法，其特征在于，所述计算设备包括检测计算设备和识别计算设备；
所述控制端将获取的待识别图像发送给云服务端的计算设备的步骤为：
所述控制端将获取的待识别图像发送给所述检测计算设备；
所述将每个所述子图像发送给所述计算设备的步骤为：
将每个所述子图像并行发送给的所述识别计算设备。

7.一种文字识别方法，其特征在于，包括：
当云服务端的计算设备接收到控制端发来的待识别图像时，从所述待识别图像中确定包含文字信息的至少一个待识别区域，并将所述待识别区域发送给所述控制端；
当所述计算设备接收到每个所述待识别区域分别对应的子图像时，分别确定每个所述子图像中包含的所述文字信息，并将分别确定的所述文字信息发送给所述控制端。

8...

【专利技术属性】
技术研发人员：朱发楠，包勇军，
申请(专利权)人：北京沃东天骏信息技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人