文字检测方法及电子设备技术

技术编号：37238697 阅读：27 留言：0更新日期：2023-04-20 23:20

本申请提供一种文字检测方法及电子设备，方法包括：将待检测图像切分为多个第一子图；各所述第一子图的尺寸满足检测模型的尺寸要求，且相邻所述第一子图之间存在重合区域；通过所述检测模型检测各所述第一子图，得到各所述第一子图对应的检测后子图；所述检测后子图中具有标识文字行的检测框；将各所述检测后子图按照各所述第一子图的切分关系拼接为检测后图像；将所述检测后图像中存在相交关系的检测框合并为一个检测框。本申请的方案可以避免出现因图像尺寸问题导致的文字行漏检、将多行文字识别为一行等异常，可使得检测效果更准确。确。确。

全部详细技术资料下载

【技术实现步骤摘要】
文字检测方法及电子设备

[0001]本申请涉及图像处理
，具体而言，涉及一种文字检测方法及电子设备。

技术介绍

[0002]OCR(Optical Character Recognition，光学文字识别)检测包括文字行检测(即通过检测框选出文本所在区域，文字行是指单行连续的文字)以及文字行识别(即对检测框选出区域的文本进行文字识别)两个部分。其中，文字行检测通常是通过将图像输入到网络模型中以框选出文字行。但是，由于网络模型训练时通常是基于常规的宽高比的图像进行训练的，因此对于一些非常规宽高比的图像，比如对于大长图(如手机新闻长截图)等图像，在检测时会因为图像尺寸问题出现文字行漏检、将多行文字识别为一行等异常。

技术实现思路

[0003]本申请实施例的目的在于提供一种文字检测方法及电子设备，用以解决上述问题。
[0004]本申请实施例提供了一种文字检测方法，包括：将待检测图像切分为多个第一子图；各所述第一子图的尺寸满足检测模型的尺寸要求，且相邻所述第一子图之间存在重合区域；通过所述检测模型检测各所述第一子图，得到各所述第一子图对应的检测后子图；所述检测后子图中具有标识文字行的检测框；将各所述检测后子图按照各所述第一子图的切分关系拼接为检测后图像；将所述检测后图像中存在相交关系的检测框合并为一个检测框。
[0005]在上述实现过程中，通过将待检测图像切分为多个满足检测模型的尺寸要求的第一子图后进行检测，从而可以保证检测模型可以可靠地进行每一幅第一子图的文字行检测，避免出现因图像尺寸...

【技术保护点】

【技术特征摘要】
1.一种文字检测方法，其特征在于，包括：将待检测图像切分为多个第一子图；各所述第一子图的尺寸满足检测模型的尺寸要求，且相邻所述第一子图之间存在重合区域；通过所述检测模型检测各所述第一子图，得到各所述第一子图对应的检测后子图；所述检测后子图中具有标识文字行的检测框；将各所述检测后子图按照各所述第一子图的切分关系拼接为检测后图像；将所述检测后图像中存在相交关系的检测框合并为一个检测框。2.如权利要求1所述的文字检测方法，其特征在于，将待检测图像切分为多个第一子图，包括：确定各所述第一子图的上下边界和左右边界，并按照各所述第一子图的上下边界和左右边界将所述待检测图像切分为多个所述第一子图。3.如权利要求1所述的文字检测方法，其特征在于，各所述第一子图的上下边界按照下述方式确定：从起始行开始逐行累加各行的文字总数量，在累进距离大于最小距离阈值且所述总数量大于预设数量阈值，或在所述累进距离大于等于最大距离阈值时，结束累加；其中，所述累进距离为当前被累加的行至所述起始行的距离，所述起始行为所述第一子图的上边界，结束累加时的行为所述第一子图的下边界；从所述结束累加时的行减去预设行数后作为新的起始行，重复上述过程；其中，所述起始行的初始值为所述待检测图像的第一行。4.如权利要求3所述的文字检测方法，其特征在于，在确定各所述第一子图的上下边界之前，所述方法还包括：对所述待检测图像进行二值化处理，并统计处理后的所述待检测图像中每一行的黑色像素点个数；其中：所述每一行的黑色像素点个数表征每一行的文字数量；相应的，所述从起始行开始逐行累加各行的文字总数量，包括：从起始行开始逐行累加各行的黑色像素点总数量。5.如权利要求2所述的文字检测方法，其特征在于，各所述第一子图的左右边界按照下述方式确定：从起始列开始逐列累加各列的文字总数量，在累进宽度大于最小宽度阈值且所述总数量大于预设数量阈值，或在所述累进宽度大于等于最大宽度阈值时，结束累加；其中，所述累进宽度为当前被累加的列至所述起始列的宽度，所述起始列为所述第一子图的左边界，结束累加时的列为所述第一子图的右边界；从所述结束累加时的列减去预设列数后作为新的起始列，重复上述过程；其中，所述起始列的初始值为所述待检测图像的第一列。6.如权利要求5所述的文字检测方法，其特征在于，在确定各所述第一子图的左右边界之前，所述方法还包括：对所述待检测图像进列二值化处理，并统计处理后的所述待检测图像中每一列的黑色像素点个数；其中：所述每一列的黑色像素点个数表征每一列的文字数量；相应的，所述从起始列开始逐列累加各列的文字总数量，包括：从起始列开始逐列累加各列的黑色像素点总数量。
7.如权利要求1所述的文字检测方法，其特征在于，各所述第一子图的左右边界之间的距离相同，且相邻两所述第一子图的左侧或右侧存在重合区域。8.如权利要求1所述的文字检测方法，其特征在于，各所述第一子图的上下边界之间的距离相同，且相邻两所述第一子图的上侧或下侧存在重合区域。9.如权利要求1所述的文字检测方法，其特征在于，将待检测图像切分为多个第一子图，包括：将所述待检测图像沿水平方向切分为至少一个第二子图；所述第二子图的宽度满足所述检测模型的尺寸要求中的宽度要求；在所述待检测图像的垂直方向按照下述方式对所述第二子图进行切分：从起始行开始逐行累加各行的文字总数量，在累进距离大于最小距离阈值且所述总数量大于预设数量阈值，或在所述累进距离大于等于最大距离阈值时，结束累加并进行切分，得到一个所述第一子图；其中，所述累进距离为当前被累加的行至所述起始行的距离；从所述结束累加时的行减去预设行数后作为新的起始行，重复上述过程。10.如权利要求9所述的文字检...

【专利技术属性】
技术研发人员：王雷，张睿，赵岭，
申请(专利权)人：上海弘玑信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人