文字识别方法、系统及存储介质技术方案

技术编号:28538363 阅读:21 留言:0更新日期:2021-05-21 09:02
本申请公开了一种文字识别方法、系统及存储介质,涉及文字识别技术。具体方案包括:控制端将获取的待识别图像发送给云服务端的计算设备;待识别图像中包含至少一个待识别的文字信息;控制端获取计算设备确定的待识别图像中包含文字信息的至少一个待识别区域;控制端根据每个待识别区域,分别确定对应的子图像,并将每个子图像发送给计算设备;子图像为待识别区域中包含的待识别图像;控制端获取计算设备从每个子图像中分别确定的文字信息。本申请可以在满足对待识别图像中的文字信息的识别精度要求的基础上,降低文字信息识别所需的计算资源成本和时间成本。

【技术实现步骤摘要】
文字识别方法、系统及存储介质
本申请涉及文字识别技术,特别是涉及一种文字识别方法、系统及存储介质。
技术介绍
随着互联网技术的发展,从图像中识别文字信息的文字识别技术有着越来越广泛的应用领域,可以广泛应用于对文档图像、车牌、广告、菜单等图像中的文字信息进行识别。现有技术中通常可以采用版面分析或深度学习的方法进行图像中的文字识别。然而,版面分析的方法需要待识别图像的版面结构有较强的规则性,且图像中包含文字信息的前景部分和包含其他图像信息的背景部分可区分性强,无法适应图像的前景部分和背景部分复杂、版面结构随意的待识别图像。而深度学习的方法进行图像处理,在处理复杂待识别图像时计算量很大。无论采用现有技术中何种方法进行文字识别,均难以满足实际使用时的识别需求,尤其当字体变化丰富、背景部分对前景部分干扰较大时,要么难以满足识别精度要求,要么耗费的计算资源成本和时间成本过大,难以承受。
技术实现思路
有鉴于此,本申请的主要目的在于提供一种文字识别方法,该方法可以克服现有技术的缺陷,在满足对待识别图像中的文字信息的识别精度要求的基础上,降低文字信息识别所需的计算资源成本和时间成本。为了达到上述目的,本申请提出的技术方案为:第一方面,本申请实施例提供了一种文字识别方法,包括以下步骤:控制端将获取的待识别图像发送给云服务端的计算设备;所述待识别图像中包含至少一个待识别的文字信息;所述控制端获取所述计算设备确定的所述待识别图像中包含所述文字信息的至少一个待识别区域;所述控制端根据每个所述待识别区域,分别确定对应的子图像,并将每个所述子图像发送给所述计算设备;所述子图像为所述待识别图像包含于所述待识别区域中的部分所述控制端获取所述计算设备从每个所述子图像中分别确定的所述文字信息。一种可能的实施方式中,所述方法还包括,所述云服务端的计算设备采用下述步骤调度:每隔预设时间间隔,所述控制端获取所述云服务端提供的每个计算设备确定所述待识别区域和所述文字信息的总负载;在所述总负载大于预设的第一负载阈值的情况下,所述控制端向所述云服务端申请分配预定数量个所述计算设备;在所述总负载小于预设的第二负载阈值的情况下,所述控制端向所述云服务端申请释放预定数量个所述计算设备。一种可能的实施方式中,所述总负载为所述云服务端提供的每个计算设备确定所述待识别区域和所述文字信息的总时间。一种可能的实施方式中,所述方法还包括,所述云服务端的计算设备采用下述步骤调度:当所述控制端获取所述待识别图像时,向所述云服务端申请分配至少一个所述计算设备,将获取的待识别图像和每个所述子图像发送给分配的所述计算设备;当所述控制端获取所述计算设备确定的所述文字信息时,向所述云服务端申请释放所述至少一个计算设备。一种可能的实施方式中,所述待识别区域为平行四边形区域;所述控制端根据每个所述待识别区域,分别确定对应的子图像的步骤包括:针对每个所述待识别区域,确定对应待识别区域的中间图像;所述中间图像为平行四边形;对所述中间图像进行旋转拉伸,得到所述子图像;所述子图像为矩形。一种可能的实施方式中,所述计算设备包括检测计算设备和识别计算设备;所述控制端将获取的待识别图像发送给云服务端的计算设备的步骤为:所述控制端将获取的待识别图像发送给所述检测计算设备;所述将每个所述子图像发送给所述计算设备的步骤为:将每个所述子图像并行发送给的所述识别计算设备。第二方面,本申请实施例还提供一种文字识别方法,包括:当云服务端的计算设备接收到控制端发来的待识别图像时,从所述待识别图像中确定包含文字信息的至少一个待识别区域,并将所述待识别区域发送给所述控制端;当所述计算设备接收到每个所述待识别区域分别对应的子图像时,分别确定每个所述子图像中包含的所述文字信息,并将分别确定的所述文字信息发送给所述控制端。一种可能的实施方式中,所述云服务端的计算设备采用下述步骤分配:当接收到所述控制端发来的分配所述计算设备的申请时,根据预设规则,所述云服务端从自身拥有的每个所述计算设备中筛选出符合所述预设规则的计算设备作为备选计算设备;根据每个所述备选计算设备的计算资源,对每个所述备选计算设备进行评分;将每个所述备选计算设备中评分最高的至少一个备选计算设备确定为目标计算设备,并将所述目标计算设备分配给所述控制端。第三方面,本申请实施例还提供一种文字识别系统,包括:控制端和云服务端;所述云服务端包括至少一个计算设备;所述计算设备用于在接收到控制端发来的待识别图像时,从所述待识别图像中确定包含文字信息的至少一个待识别区域,并将所述待识别区域发送给所述控制端;还用于在接收到每个所述待识别区域分别对应的子图像时,分别确定每个所述子图像中包含的所述文字信息,并将分别确定的所述文字信息发送给所述控制端;所述控制端包括识别装置;所述识别装置分别与每个所述计算设备连接;所述识别装置用于将所述待识别图像和每个所述子图像发送给所述云服务端的计算设备,并接收所述计算设备确定的所述待识别区域和所述文字信息;还用于根据每个所述待识别区域,分别确定对应的子图像。一种可能的实施方式中,所述云服务端还包括:主计算设备;所述主计算设备连接每个所述计算设备;所述主计算设备用于进行所述计算设备的调度;所述控制端还包括:资源调度器;所述资源调度器分别连接所述识别装置和所述主计算设备;所述资源调度器用于向所述主计算设备申请分配或释放所述计算设备。一种可能的实施方式中,所述控制端还包括:服务网关;所述服务网关连接所述识别装置;所述服务网关用于获取所述待识别图像。一种可能的实施方式中,所述计算设备包括检测计算设备和识别计算设备;所述检测计算设备和所述识别计算设备分别与所述主计算设备和所述识别装置连接;所述检测计算设备用于接收所述待识别图像;还用于从所述待识别图像中确定包含文字信息的至少一个待识别区域;所述识别计算设备用于接收所述子图像;还用于确定所述子图像中包含的所述文字信息。一种可能的实施方式中,所述检测计算设备中包括图形处理器。一种可能的实施方式中,所述识别计算设备中包括中央处理器。第四方面,本申请实施例还提供一种计算机可读存储介质。具体方案为:一种计算机可读存储介质,存储有计算机指令,所述指令被处理器执行时可实现上述第一方面及第一方面中任一种可能的实施方式,或者实现上述第二方面及第二方面中任一种可能的实施方式的步骤。第五方面,本申请实施例还提供一种电子设备。具体方案为:一种电子设备,该电子设备包括上述的计算机可读存储介质,还包括可执行所述计算机可读存储介质的处理器。综上所述,本申请提出的一种文字识别方法,利用云服务端的计算设备进行待识别图像中文字信息的识别,首先将获取的待识别图像发送给计算设备,由计算设备本文档来自技高网...

【技术保护点】
1.一种文字识别方法,其特征在于,包括:/n控制端将获取的待识别图像发送给云服务端的计算设备;所述待识别图像中包含至少一个待识别的文字信息;/n所述控制端获取所述计算设备确定的所述待识别图像中包含所述文字信息的至少一个待识别区域;/n所述控制端根据每个所述待识别区域,分别确定对应的子图像,并将每个所述子图像发送给所述计算设备;所述子图像为所述待识别图像包含于所述待识别区域中的部分;/n所述控制端获取所述计算设备从每个所述子图像中分别确定的所述文字信息。/n

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:
控制端将获取的待识别图像发送给云服务端的计算设备;所述待识别图像中包含至少一个待识别的文字信息;
所述控制端获取所述计算设备确定的所述待识别图像中包含所述文字信息的至少一个待识别区域;
所述控制端根据每个所述待识别区域,分别确定对应的子图像,并将每个所述子图像发送给所述计算设备;所述子图像为所述待识别图像包含于所述待识别区域中的部分;
所述控制端获取所述计算设备从每个所述子图像中分别确定的所述文字信息。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括,所述云服务端的计算设备采用下述步骤调度:
每隔预设时间间隔,所述控制端获取所述云服务端提供的每个计算设备确定所述待识别区域和所述文字信息的总负载;
在所述总负载大于预设的第一负载阈值的情况下,所述控制端向所述云服务端申请分配预定数量个所述计算设备;
在所述总负载小于预设的第二负载阈值的情况下,所述控制端向所述云服务端申请释放预定数量个所述计算设备。


3.根据权利要求2所述的方法,其特征在于,所述总负载为所述云服务端提供的每个计算设备确定所述待识别区域和所述文字信息的总时间。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括,所述云服务端的计算设备采用下述步骤调度:
当所述控制端获取所述待识别图像时,向所述云服务端申请分配至少一个所述计算设备,将获取的待识别图像和每个所述子图像发送给分配的所述计算设备;
当所述控制端获取所述计算设备确定的所述文字信息时,向所述云服务端申请释放所述至少一个计算设备。


5.根据权利要求1所述的方法,其特征在于,所述待识别区域为平行四边形区域;
所述控制端根据每个所述待识别区域,分别确定对应的子图像的步骤包括:
针对每个所述待识别区域,确定对应待识别区域的中间图像;所述中间图像为平行四边形;
对所述中间图像进行旋转拉伸,得到所述子图像;所述子图像为矩形。


6.根据权利要求1所述的方法,其特征在于,所述计算设备包括检测计算设备和识别计算设备;
所述控制端将获取的待识别图像发送给云服务端的计算设备的步骤为:
所述控制端将获取的待识别图像发送给所述检测计算设备;
所述将每个所述子图像发送给所述计算设备的步骤为:
将每个所述子图像并行发送给的所述识别计算设备。


7.一种文字识别方法,其特征在于,包括:
当云服务端的计算设备接收到控制端发来的待识别图像时,从所述待识别图像中确定包含文字信息的至少一个待识别区域,并将所述待识别区域发送给所述控制端;
当所述计算设备接收到每个所述待识别区域分别对应的子图像时,分别确定每个所述子图像中包含的所述文字信息,并将分别确定的所述文字信息发送给所述控制端。


8...

【专利技术属性】
技术研发人员:朱发楠包勇军
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1