文字检测方法及电子设备技术

技术编号:37238697 阅读:19 留言:0更新日期:2023-04-20 23:20
本申请提供一种文字检测方法及电子设备,方法包括:将待检测图像切分为多个第一子图;各所述第一子图的尺寸满足检测模型的尺寸要求,且相邻所述第一子图之间存在重合区域;通过所述检测模型检测各所述第一子图,得到各所述第一子图对应的检测后子图;所述检测后子图中具有标识文字行的检测框;将各所述检测后子图按照各所述第一子图的切分关系拼接为检测后图像;将所述检测后图像中存在相交关系的检测框合并为一个检测框。本申请的方案可以避免出现因图像尺寸问题导致的文字行漏检、将多行文字识别为一行等异常,可使得检测效果更准确。确。确。

【技术实现步骤摘要】
文字检测方法及电子设备


[0001]本申请涉及图像处理
,具体而言,涉及一种文字检测方法及电子设备。

技术介绍

[0002]OCR(Optical Character Recognition,光学文字识别)检测包括文字行检测(即通过检测框选出文本所在区域,文字行是指单行连续的文字)以及文字行识别(即对检测框选出区域的文本进行文字识别)两个部分。其中,文字行检测通常是通过将图像输入到网络模型中以框选出文字行。但是,由于网络模型训练时通常是基于常规的宽高比的图像进行训练的,因此对于一些非常规宽高比的图像,比如对于大长图(如手机新闻长截图)等图像,在检测时会因为图像尺寸问题出现文字行漏检、将多行文字识别为一行等异常。

技术实现思路

[0003]本申请实施例的目的在于提供一种文字检测方法及电子设备,用以解决上述问题。
[0004]本申请实施例提供了一种文字检测方法,包括:将待检测图像切分为多个第一子图;各所述第一子图的尺寸满足检测模型的尺寸要求,且相邻所述第一子图之间存在重合区域;通过所述检测模型检测各所述第一子图,得到各所述第一子图对应的检测后子图;所述检测后子图中具有标识文字行的检测框;将各所述检测后子图按照各所述第一子图的切分关系拼接为检测后图像;将所述检测后图像中存在相交关系的检测框合并为一个检测框。
[0005]在上述实现过程中,通过将待检测图像切分为多个满足检测模型的尺寸要求的第一子图后进行检测,从而可以保证检测模型可以可靠地进行每一幅第一子图的文字行检测,避免出现因图像尺寸问题导致的文字行漏检、将多行文字识别为一行等异常。而通过在相邻的第一子图之间留出重合区域,这就使得相邻的第一子图在被检测后,相邻的第一子图中重合区域内的文字行会有重合,从而使得相邻的第一子图中针对同一文字行中的文字,检测框会存在相交关系,从而可以基于此进行检测框合并,实现对于一行文字的检测框完整输出,使得检测效果更准确。
[0006]进一步地,将待检测图像切分为多个第一子图,包括:确定各所述第一子图的上下边界和左右边界,并按照各所述第一子图的上下边界和左右边界将所述待检测图像切分为多个所述第一子图。
[0007]在上述实现过程中,通过确定各第一子图的上下边界和左右边界,从而按照各第一子图的上下边界和左右边界对待检测图像进行切分,可以快速、准确地得到具有重合区域的相邻的第一子图。
[0008]进一步地,各所述第一子图的上下边界按照下述方式确定:从起始行开始逐行累加各行的文字总数量,在累进距离大于最小距离阈值且所述总数量大于预设数量阈值,或在所述累进距离大于等于最大距离阈值时,结束累加;其中,所述累进距离为当前被累加的
行至所述起始行的距离,所述起始行为所述第一子图的上边界,结束累加时的行为所述第一子图的下边界;从所述结束累加时的行减去预设行数后作为新的起始行,重复上述过程;其中,所述起始行的初始值为所述待检测图像的第一行。
[0009]在上述实现过程中,通过在待检测图像的垂直方向上(第一子图的上下边界位于待检测图像的垂直方向上)基于逐行累加得到的文字总数量,以及累进距离进行边界确定,从而可以在满足检测模型的尺寸要求的情况下,防止第一子图内的文字过多。而图像内的文字越多,检测模型的处理压力越大,可靠性相应的会变低。而上述实现过程可以防止生成的第一子图内的文字过多,从而可以更充分地利用检测模型的性能,保证检测效果的可靠性。
[0010]进一步地,在确定各所述第一子图的上下边界之前,所述方法还包括:对所述待检测图像进行二值化处理,并统计处理后的所述待检测图像中每一行的黑色像素点个数;其中:所述每一行的黑色像素点个数表征每一行的文字数量;相应的,所述从起始行开始逐行累加各行的文字总数量,包括:从起始行开始逐行累加各行的黑色像素点总数量。
[0011]在上述实现过程中,通过对待检测图像进行二值化处理,可以快速实现待检测图像中文字与背景的区分,从而可以快速实现对于文字数量的统计。
[0012]进一步地,各所述第一子图的左右边界按照下述方式确定:从起始列开始逐列累加各列的文字总数量,在累进宽度大于最小宽度阈值且所述总数量大于预设数量阈值,或在所述累进宽度大于等于最大宽度阈值时,结束累加;其中,所述累进宽度为当前被累加的列至所述起始列的宽度,所述起始列为所述第一子图的左边界,结束累加时的列为所述第一子图的右边界;从所述结束累加时的列减去预设列数后作为新的起始列,重复上述过程;其中,所述起始列的初始值为所述待检测图像的第一列。
[0013]在上述实现过程中,通过在待检测图像的水平方向上(第一子图的左右边界位于待检测图像的水平方向上)基于逐列累加得到的文字总数量,以及累进距离进行边界确定,从而可以在满足检测模型的尺寸要求的情况下,防止第一子图内的文字过多。而图像内的文字越多,检测模型的处理压力越大,可靠性相应的会变低。而上述实现过程可以防止生成的第一子图内的文字过多,从而可以更充分地利用检测模型的性能,保证检测效果的可靠性。
[0014]进一步地,在确定各所述第一子图的左右边界之前,所述方法还包括:对所述待检测图像进列二值化处理,并统计处理后的所述待检测图像中每一列的黑色像素点个数;其中:所述每一列的黑色像素点个数表征每一列的文字数量;相应的,所述从起始列开始逐列累加各列的文字总数量,包括:从起始列开始逐列累加各列的黑色像素点总数量。
[0015]进一步地,各所述第一子图的左右边界之间的距离相同,且相邻两所述第一子图的左侧或右侧存在重合区域。
[0016]在上述实现过程中,各第一子图的左右边界之间的距离相同,也即待检测图像在水平方向上是等间距切分的,这样实现更为简单可靠。而相邻两第一子图的左侧或右侧存在重合区域,可以保证相邻的第一子图中针对同一文字行中的文字,检测框会存在相交关系,从而可以进行检测框合并,实现对于一行文字的检测框完整输出,使得检测效果更准确。
[0017]进一步地,各所述第一子图的上下边界之间的距离相同,且相邻两所述第一子图
的上侧或下侧存在重合区域。
[0018]类似的,在上述实现过程中,各第一子图的上下边界之间的距离相同,也即待检测图像在垂直方向上是等间距切分的,这样实现更为简单可靠。而相邻两第一子图的上侧或下侧存在重合区域,可以保证相邻的第一子图中针对同一文字行中的文字,检测框会存在相交关系,从而可以进行检测框合并,实现对于一行文字的检测框完整输出,使得检测效果更准确。
[0019]进一步地,将待检测图像切分为多个第一子图,包括:将所述待检测图像沿水平方向切分为至少一个第二子图;所述第二子图的宽度满足所述检测模型的尺寸要求中的宽度要求;在所述待检测图像的垂直方向按照下述方式对所述第二子图进行切分:从起始行开始逐行累加各行的文字总数量,在累进距离大于最小距离阈值且所述总数量大于预设数量阈值,或在所述累进距离大于等于最大距离阈值时,结束累加并进行切分,得到一个所述第一子图;其中,所述累进距离为当前被累加的行至所述起本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文字检测方法,其特征在于,包括:将待检测图像切分为多个第一子图;各所述第一子图的尺寸满足检测模型的尺寸要求,且相邻所述第一子图之间存在重合区域;通过所述检测模型检测各所述第一子图,得到各所述第一子图对应的检测后子图;所述检测后子图中具有标识文字行的检测框;将各所述检测后子图按照各所述第一子图的切分关系拼接为检测后图像;将所述检测后图像中存在相交关系的检测框合并为一个检测框。2.如权利要求1所述的文字检测方法,其特征在于,将待检测图像切分为多个第一子图,包括:确定各所述第一子图的上下边界和左右边界,并按照各所述第一子图的上下边界和左右边界将所述待检测图像切分为多个所述第一子图。3.如权利要求1所述的文字检测方法,其特征在于,各所述第一子图的上下边界按照下述方式确定:从起始行开始逐行累加各行的文字总数量,在累进距离大于最小距离阈值且所述总数量大于预设数量阈值,或在所述累进距离大于等于最大距离阈值时,结束累加;其中,所述累进距离为当前被累加的行至所述起始行的距离,所述起始行为所述第一子图的上边界,结束累加时的行为所述第一子图的下边界;从所述结束累加时的行减去预设行数后作为新的起始行,重复上述过程;其中,所述起始行的初始值为所述待检测图像的第一行。4.如权利要求3所述的文字检测方法,其特征在于,在确定各所述第一子图的上下边界之前,所述方法还包括:对所述待检测图像进行二值化处理,并统计处理后的所述待检测图像中每一行的黑色像素点个数;其中:所述每一行的黑色像素点个数表征每一行的文字数量;相应的,所述从起始行开始逐行累加各行的文字总数量,包括:从起始行开始逐行累加各行的黑色像素点总数量。5.如权利要求2所述的文字检测方法,其特征在于,各所述第一子图的左右边界按照下述方式确定:从起始列开始逐列累加各列的文字总数量,在累进宽度大于最小宽度阈值且所述总数量大于预设数量阈值,或在所述累进宽度大于等于最大宽度阈值时,结束累加;其中,所述累进宽度为当前被累加的列至所述起始列的宽度,所述起始列为所述第一子图的左边界,结束累加时的列为所述第一子图的右边界;从所述结束累加时的列减去预设列数后作为新的起始列,重复上述过程;其中,所述起始列的初始值为所述待检测图像的第一列。6.如权利要求5所述的文字检测方法,其特征在于,在确定各所述第一子图的左右边界之前,所述方法还包括:对所述待检测图像进列二值化处理,并统计处理后的所述待检测图像中每一列的黑色像素点个数;其中:所述每一列的黑色像素点个数表征每一列的文字数量;相应的,所述从起始列开始逐列累加各列的文字总数量,包括:从起始列开始逐列累加各列的黑色像素点总数量。
7.如权利要求1所述的文字检测方法,其特征在于,各所述第一子图的左右边界之间的距离相同,且相邻两所述第一子图的左侧或右侧存在重合区域。8.如权利要求1所述的文字检测方法,其特征在于,各所述第一子图的上下边界之间的距离相同,且相邻两所述第一子图的上侧或下侧存在重合区域。9.如权利要求1所述的文字检测方法,其特征在于,将待检测图像切分为多个第一子图,包括:将所述待检测图像沿水平方向切分为至少一个第二子图;所述第二子图的宽度满足所述检测模型的尺寸要求中的宽度要求;在所述待检测图像的垂直方向按照下述方式对所述第二子图进行切分:从起始行开始逐行累加各行的文字总数量,在累进距离大于最小距离阈值且所述总数量大于预设数量阈值,或在所述累进距离大于等于最大距离阈值时,结束累加并进行切分,得到一个所述第一子图;其中,所述累进距离为当前被累加的行至所述起始行的距离;从所述结束累加时的行减去预设行数后作为新的起始行,重复上述过程。10.如权利要求9所述的文字检...

【专利技术属性】
技术研发人员:王雷张睿赵岭
申请(专利权)人:上海弘玑信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1