字符识别处理方法和装置制造方法及图纸

技术编号:27686970 阅读:17 留言:0更新日期:2021-03-17 04:04
本申请公开了一种字符识别处理方法和装置,涉及深度学习技术领域、图像处理技术领域。具体实现方案为:对样本图片集合中每张图片里的字符标注字符区域;标注与每个字符区域对应的字符类别和字符位置编码;根据标注字符区域的样本图片集合,以及与每个字符区域对应的字符类别和字符位置编码,训练预设的用于字符识别的神经网络模型。由此,实现了对图片中字符顺序的识别,提高了字符识别的精度。

【技术实现步骤摘要】
字符识别处理方法和装置
本申请涉及深度学习
、图像处理
,尤其涉及一种字符识别处理方法和装置。
技术介绍
通常,字符识别是一种从图片中提取文本信息的方法,在金融,教育,审查,交通出行等众多关乎国计民生的领域都有着重大的应用需求。相关技术中,在对字符识别时,基于字符在图片中的相对顺序对识别到的字符进行排列,比如,根据从左到右的顺序对识别得到的字符进行排序,然而,当多个字符并不是按照相对顺序排序时,显然会导致识别的字符序列是乱序的。
技术实现思路
本申请提提供了一种用于对字符序列进行识别的字符识别处理方法和装置。根据第一方面,提供了一种字符识别处理方法,包括:对样本图片集合中每张图片里的字符标注字符区域;标注与每个所述字符区域对应的字符类别和字符位置编码;根据所述标注字符区域的所述样本图片集合,以及与每个所述字符区域对应的字符类别和字符位置编码,训练预设的用于字符识别的神经网络模型。根据第二方面,提供了一种字符识别处理装置,包括:第一标注模块,用于对样本图片集合中每张图片里的字符标注字符区域;第二标注模块,用于标注与每个所述字符区域对应的字符类别和字符位置编码;训练模块,用于根据所述标注字符区域的所述样本图片集合,以及与每个所述字符区域对应的字符类别和字符位置编码,训练预设的用于字符识别的神经网络模型。根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的字符识别处理方法。根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质所述计算机指令用于使所述计算机执行上述第一方面所述的字符识别处理方法。根据第五方面,提供了一种计算机程序产品,当所述计算机程序产品中的指令由处理器执行时,执行上述第一方面所述的字符识别处理方法。本申请提供的实施例,至少具有如下有益技术效果:对样本图片集合中每张图片里的字符标注字符区域,标注与每个所述字符区域对应的字符类别和字符位置编码,进而,根据所述标注字符区域的所述样本图片集合,以及与每个所述字符区域对应的字符类别和字符位置编码,训练预设的用于字符识别的神经网络模型,以便于根据神经网络模型识别字符和字符顺序,由此,通过字符位置编码对字符进行排序得到字符相对顺序,最后基于排序组合字符得到最终结果,实现了字符识别的顺序排列。应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是根据本申请第一实施例的样本图片的示意图;图2是根据本申请第二实施例的字符识别处理方法的流程示意图;图3是根据本申请第三实施例的样本图片的示意图;图4是根据本申请第四实施例的样本图片的示意图;图5是根据本申请第五实施例的语义分割图片示意图;图6是根据本申请第六实施例的字符识别处理方法的流程示意图;图7是根据本申请第七实施例的字符识别处理场景示意图;图8是根据本申请第八实施例的字符识别处理装置的结构框图;图9是根据本申请第九实施例的字符识别处理装置的结构框图;图10是用来实现本申请实施例的字符识别处理的方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。针对上述
技术介绍
中提到的,基于相对位置识别字符的顺序导致识别字符序列可能错误的问题,比如,如图1所示,对于字符“HAPPY”若是按照其在图片中的相对顺序之别得到的字符序列为“HPAPY”。为了解决该技术问题,本申请提出了一种语义分割来识别字符,通过预测字符的位置编码来确定每个字符的在字符序列中的相对顺序。具体而言,图2是根据本申请一个实施例的字符识别处理方法的流程图,如图2所示,该方法包括:步骤201,对样本图片集合中每张图片里的字符标注字符区域。其中,样本图片集合中包含了大量的样本图片,每个样本图片中包含多个字符,该字符包括但不限于英文、数字、文字等。在本实施例中,对样本图片集合中的每张图片里的字符标注字符区域,其中,标注字符区域作为每个字符的包围盒确定字符所在区域。需要说明的是,在不同的应用场景中,对样本图片集合中每张图片里的字符标注字符区域的方式不同,示例如下:示例一:获取每张图片里与每个字符相对应的字符框的位置坐标,该位置坐标可以包括每个字符中心点像素坐标、字符框的长和宽,其中,在本实施例中,确定的字符框的长和宽,可以根据每个字符最上方的像素点坐标、最下方的像素点坐标、最左像素点的像素坐标和最右像素点的像素点坐标限定。进而,根据预设的收缩比率和位置坐标对字符框进行收缩处理,以便于区分不同字符区域,避免将两个相同的相邻字符认为是一个字符识别,根据缩放后的字符框位置坐标标注字符区域。在本实施例中,预设的收缩比率可以是根据实验数据设置的,也可以是根据相邻字符的距离设置的,比如,可以确定预设的收缩比率对应的标准距离,确定图片中每两个相邻字符的中心像素点的距离,若是该距离大于标准距离,则计算该距离与标准距离的差值,若是该差值大于预设距离阈值,则表明没有误识别的风险,从而,将预设的收缩比率调整为1,若是该距离小于标准距离,则计算标准距离与该距离的差值,根据该差值确定收缩比率的增大值,其中,差值和增大值成正比关系,进而,在预设的收缩比率上增加该增大值,以确定当前字符框(可以是相邻的2个字符框的任一个)的收缩比率。举例而言,当样本图片如图3所示,为了保证字符以连通域的形式分离开,对于每一个字符框(cx,cy,w,h,其中cx,cy表示字符框中心点坐标,w,h表示字符框的宽和高),我们将字符框基于字符框收缩得到(cx,cy,w*r,h*r,其中r为收缩比率)。示例二:在本示例中,预先根据深度学习技术训练得到语义识别模型,根据该语义识别模型识别样本图片集合中每个图片中每个像素点对应的字符类别的概率,选取概率值最大的字符类别为对应像素点的字符类别,进而,将所有属于相同字符类别的像素点组成的连通区域确定为一个字符区域。在本实施例中,字符区域标注可以为记录字符框像素位置或者是采用线条在图片中标注等。步骤202,标注与每个字符区域对应的字符类别和字符位置编码。在本实施例中,为了进一步识别出每个字符的位置,标注与每个字符区域对应的字符类别和字符位置编码,其中,基本文档来自技高网
...

【技术保护点】
1.一种字符识别处理方法,其特征在于,包括:/n对样本图片集合中每张图片里的字符标注字符区域;/n标注与每个所述字符区域对应的字符类别和字符位置编码;/n根据所述标注字符区域的所述样本图片集合,以及与每个所述字符区域对应的字符类别和字符位置编码,训练预设的用于字符识别的神经网络模型。/n

【技术特征摘要】
1.一种字符识别处理方法,其特征在于,包括:
对样本图片集合中每张图片里的字符标注字符区域;
标注与每个所述字符区域对应的字符类别和字符位置编码;
根据所述标注字符区域的所述样本图片集合,以及与每个所述字符区域对应的字符类别和字符位置编码,训练预设的用于字符识别的神经网络模型。


2.如权利要求1所述的方法,其中,所述对样本图片集合中每张图片里的字符标注字符区域,包括:
获取所述每张图片里与每个字符相对应的字符框的位置坐标;
根据预设的收缩比率和所述位置坐标对所述字符框进行收缩处理,根据缩放后的字符框位置坐标标注所述字符区域。


3.如权利要求1所述的方法,其中,所述标注与每个所述字符区域对应的所述字符类别,包括:
为每个所述字符区域中的像素点赋值为所述字符区域中字符类别预设的索引值。


4.如权利要求1所述的方法,其中,所述标注与每个所述字符区域对应的所述字符位置编码,包括:
获取预设的字符串长度阈值;
获取每个所述字符区域的位置索引值;
按照预设算法对所述字符串长度阈值和所述位置索引值进行计算,根据计算结果标注每个所述字符区域对应的所述字符位置编码。


5.如权利要求1-4任一所述的方法,还包括:
获取待识别的目标图片;
根据所述神经网络模型对所述目标图片进行处理,获取预测字符以及与每个所述预测字符对应的字符位置编码;
根据与每个所述预测字符对应的字符位置编码对所述预测字符进行排序,生成目标字符。


6.一种字符识别处理装置,包括:
第一标注模块,用于对样本图片集合中每张图片里的字符标注字符区域;
第二标注模块,用于标注与每个所述字符区域对应的字符类别和字符位置编码;
训练模块,用于根据所述标注字符区域的所述样本图片集合,以及与每个所述字符区域对应的字符类别和字符位置编码,训练预...

【专利技术属性】
技术研发人员:吕鹏原章成全
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1