文字识别方法、电子设备和计算机可读存储介质技术

技术编号:33874343 阅读:34 留言:0更新日期:2022-06-22 17:02
本发明专利技术实施例涉及互联网技术领域,特别涉及一种文字识别方法、电子设备和计算机可读存储介质。上述文字识别方法包括:获取待识别图像的二值掩码图;其中,所述二值掩码图用于区分所述待识别图像中的文字区域和非文字区域;对所述二值掩码图进行连通域分析,获取连通域标记;根据所述连通域标记,获取平直文字效果图;根据所述平直文字效果图,识别文字。本发明专利技术实施例提供的文字识别方法,旨在提升弯曲文字的识别准确率和识别速度,同时提高弯曲文字过程的抗噪能力,从而大幅提升用户的使用体验。从而大幅提升用户的使用体验。从而大幅提升用户的使用体验。

【技术实现步骤摘要】
文字识别方法、电子设备和计算机可读存储介质


[0001]本申请实施例涉及文字检测和识别领域,特别涉及一种文字识别方法、电子设备和计算机可读存储介质。

技术介绍

[0002]随着机器学习技术的飞速发展,人类已进入机器学习的时代,机器学习在机器视觉、自然语言处理、语音识别等领域大放异彩。文字在人类的生产生活中无处不在,文字通常具有字符众多、语言众多、字体多样、排布不均、尺寸不一、颜色各异等特点,即文字在自然场景中经常是以弯曲状态存在的。
[0003]这种现象尤其存在于工业场景中,工业场景对文字识别需求很大,通过文字识别,工厂进货时可自动获取产品信息,诸如批次号、产地、质量层级等;出货时可检测产品印刷信息的准确性,保证产品质量,文字识别可助力工厂进行自动化生产、智能化转型,在以数字化为主题的今天,这将是企业、工厂不可或缺的能力。但在工厂环境中,文字形状多随工业产品的表面曲率变化而呈现弯曲变形,这给文字检测和识别带来了巨大的困难。
[0004]然而,相关的弯曲文字识别算法,识别精度不高,抗噪能力较低,不能满足用户日益增长的弯曲文字识别需求。

技术实现思路

[0005]本申请实施例的主要目的在于提出一种文字识别方法、电子设备和计算机可读存储介质,可以有效提升弯曲文字的识别准确率和识别速度,同时提高了弯曲文字过程的抗噪能力,大幅提升用户的使用体验。
[0006]为实现上述目的,本申请实施例还提供了一种电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述的文字识别方法。
[0007]为实现上述目的,本申请实施例还提供了一种可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时实现上述的文字识别方法。
[0008]本申请提出的文字识别方法、电子设备和计算机可读存储介质,获取待识别图像的二值掩码图,其中,所述二值掩码图用于区分所述待识别图像中的文字区域和非文字区域,使用二值掩码图,可以准确、迅速地确定待识别图像中哪些位置有文字,防止在识别时丢失待识别图像中的部分文字。对所述二值掩码图进行连通域分析,获取连通域标记,由于二值掩码图只有0和255两种像素值,对二值掩码图进行连通域分析,获取连通域标记,可以将待识别图像数据化,为分析和识别带来了方便。根据连通域标记,获取平直文字效果图,考虑到相关的弯曲文字识别技术需要根据已有的词典,计算每个文字的角度,还需要将各个弯曲文字之间进行分离,对每个文字自身进行复杂的计算,这也就导致识别过程比较复杂而且费时,而本专利技术的实施例,直接对二值掩码图进行处理,不需要计算每个弯曲文字弯
曲的角度,可以简单、快速地将弯曲文字变换成平直文字。根据所述平直文字效果图,识别文字,可以有效提升弯曲文字的识别准确率和识别速度,同时提高了弯曲文字过程的抗噪能力,从而大幅提升用户的使用体验。
附图说明
[0009]图1是根据本专利技术第一实施例的文字识别方法的流程图;
[0010]图2是根据本专利技术第一实施例提供的一种待识别图像;
[0011]图3是根据本专利技术第一实施例提供的一种待识别图像的二值掩码图;
[0012]图4是根据本专利技术第一实施例提供的一种平直文字效果图;
[0013]图5是根据本专利技术第一实施例中,根据连通域标记,获取平直文字效果图的流程图;
[0014]图6是根据本专利技术第一实施例提供的又一种待识别图像;
[0015]图7是根据本专利技术第一实施例提供的又一种待识别图像的二值掩码图;
[0016]图8是根据本专利技术第一实施例提供的又一种待识别图像的二值掩码图的目标文字区域示意图;
[0017]图9是根据本专利技术第一实施例提供的又一种平直文字效果图;
[0018]图10是根据本专利技术第一实施例的一种文字识别装置的示意图;
[0019]图11是根据本专利技术第二实施例的文字识别方法的流程图;
[0020]图12是根据本专利技术第二实施例中,在目标文字区域中确定M个插值坐标点的流程图;
[0021]图13是根据本专利技术第二实施例提供的一种轴点和起止边缘点的示意图;
[0022]图14是根据本专利技术第三实施例的文字识别方法的流程图;
[0023]图15是根据本专利技术第三实施例提供的一种待识别图像;
[0024]图16是根据本专利技术第三实施例提供的一种待识别图像的二值掩码图;
[0025]图17是根据本专利技术第三实施例提供的一种待识别图像的二值掩码图的水平的目标文字区域;
[0026]图18是根据本专利技术第三实施例提供的一种平直文字效果图;
[0027]图19是根据本专利技术第三实施例提供的一种多边形拟合图;
[0028]图20是根据本专利技术第四实施例的文字识别方法的流程图;
[0029]图21是根据本专利技术第四实施例提供的一种训练检测模型方法的流程图;
[0030]图22是根据本专利技术第四实施例提供的一种训练识别模型方法的流程图;
[0031]图23是根据本专利技术第四实施例提供的一种对钢卷上的文字进行识别的流程图;
[0032]图24是根据本专利技术第五实施例的电子设备的结构示意图。
具体实施方式
[0033]为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合附图对本申请的各实施例进行详细的阐述。然而,本领域的普通技术人员可以理解,在本申请各实施例中,为了使读者更好地理解本申请而提出了许多技术细节。但是,即使没有这些技术细节和基于以下各实施例的种种变化和修改,也可以实现本申请所要求保护的技术方案。以下各
个实施例的划分是为了描述方便,不应对本申请的具体实现方式构成任何限定,各个实施例在不矛盾的前提下可以相互结合相互引用。
[0034]本专利技术的第一实施例涉及一种文字识别方法,应用于电子设备,其中,电子设备可以为终端或服务器,本实施例以及以下各个实施例中电子设备以服务器为例进行说明。下面对本实施例的文字识别方法的实现细节进行具体的说明,以下内容仅为方便理解提供的实现细节,并非实施本方案的必须。
[0035]本专利技术的实施例的应用场景可以包括但不限于:工厂进货时自动获取产品信息;工厂出货时检测产品的印刷信息,如生产日期、产地等;工商部门录入商家商标信息;使用光学识别技术(Optical Character Recognition,简称:OCR技术)将纸质文件扫描形成电子文件;身份证、护照、行驶证、银行卡等证件识别;车牌号码、车牌颜色、车牌类型等车牌识别与追踪;增值税发票的票据类识别等。
[0036]本实施例的文字识别方法的具体流程可以如图1所示,包括:
[0037]步骤101,获取待识别图像的二值掩码图;
[0038]具体而言,服务器可以获取待识别图像的二值掩码图。其中,二值掩码图用于区分待识别图像中的文字区域和非文字区域。...

【技术保护点】

【技术特征摘要】
1.一种文字识别方法,其特征在于,包括:获取待识别图像的二值掩码图;其中,所述二值掩码图用于区分所述待识别图像中的文字区域和非文字区域;对所述二值掩码图进行连通域分析,获取连通域标记;根据所述连通域标记,获取平直文字效果图;根据所述平直文字效果图,识别文字。2.根据权利要求1所述的文字识别方法,其特征在于,所述根据所述连通域标记,获取平直文字效果图,包括:根据所述连通域标记,对所述二值掩码图进行插值,获取平直文字效果图。3.根据权利要求2所述的文字识别方法,其特征在于,所述根据所述连通域标记,对所述二值掩码图进行插值,获取平直文字效果图,包括:根据所述连通域标记,对所述二值掩码图进行最小边框拟合,获取目标文字区域;对所述二值掩码图的所述目标文字区域进行插值,获取平直文字效果图。4.根据权利要求3所述的文字识别方法,其特征在于,所述对所述二值掩码图的所述目标文字区域进行插值,获取平直文字效果图,包括:在所述目标文字区域中确定M个插值坐标点;其中,M是大于1的整数;根据所述M个插值坐标点,对所述二值掩码图的所述目标文字区域进行插值,获取平直文字效果图。5.根据权利要求4所述的文字识别方法,其特征在于,所述在所述目标文字区域中确定M个插值坐标点,包括:获取所述目标文字区域的宽度;根据所述宽度,在所述目标文字区域中确定N个轴点和起止边缘点;其中,N为大于0的整数;根据所述N个轴点和所述起止边缘点,在所述目标文字区域中确定M个插值坐标点。6.根据权利要求3所述的文字识别方法,其特征在于,所述根据所述连通域标记,对所述二值掩码图进行最小边框拟合,获取目标文字区域,包括:根据所述连通域标记,对所述二值掩码图进行透视变换和最小边框拟合,获取水平的目标文字区域;所述对所述二值掩码图的所述目标文字区域进行插值,获取平直文字效果图,包括:对所述二值掩码图的所述水平的目标文字区域进行插值,获取平直文字效果图。7.根据权利要求6所述的文字识别方法,...

【专利技术属性】
技术研发人员:吕燕童俊文王佳
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1