一种文本区域检测方法、电子设备及计算机存储介质技术

技术编号：28476351 阅读：15 留言：0更新日期：2021-05-15 21:45

本申请实施例提供了一种文本区域检测方法、电子设备及计算机存储介质。根据本申请实施例提供的文本区域检测方案，对待识别图像进行的第一卷积，生成第一特征图像，以及，根据所述第一特征图像预测得到包含偏移量矩阵的卷积核，并采用包含偏移量矩阵的卷积核对所述待识别图像进行第二卷积，生成第二特征图像，进而融合所述第一特征图像和所述第二特征图像，生成目标特征图像，从而基于目标特征图像预测得到中心点的坐标值，以及，基于第二特征图像预测得到边界点相对于所述中心点的坐标值的偏移量，进而确定得到边界点的坐标值，并根据所述边界点的坐标值确定文本区域。所述边界点的坐标值确定文本区域。所述边界点的坐标值确定文本区域。

全部详细技术资料下载

【技术实现步骤摘要】
一种文本区域检测方法、电子设备及计算机存储介质

[0001]本申请实施例涉及计算机
，尤其涉及一种文本区域检测方法、电子设备及计算机存储介质。

技术介绍

[0002]在针对文本区域（即用户手写输入所产生的文字区域）的检测中，经常会出现文本区域非常密集的实际应用场景。例如，在一张小学生的算术练习册上，可能一张图像上就有100个左右的文本区域。
[0003]常规方式中进行文本区域的检测，主要包括基于滑动窗口的文本检测方法，以及，基于计算连通域的方法。基于滑动窗口的文本检测方法需要耗费大量计算资源进行遍历搜索，以及对每个搜索框进行分类判定，计算量过大，耗时较长；而基于计算连通域的方法需要涉及大量的计算和调优。
[0004]在图像中的文本区域不多的情形下，常规方式还可以接受。但是随着文本框数量的增长，常规的检测方式的速度下降明显，无法满足实际应用场景的速度需求。基于此，需要一种更快速的文本区域检测方案。

技术实现思路

[0005]有鉴于此，本申请实施例提供一种文本区域检测方案，以至少部分解决上述问题。
[0006]根据本申请实施例的第一方面，提供了一种文本区域检测方法，包括：获取待识别图像；对所述待识别图像进行第一卷积，生成第一特征图像，以及，根据所述第一特征图像预测得到包含偏移量矩阵的卷积核，并采用包含偏移量矩阵的卷积核对所述待识别图像进行第二卷积，生成第二特征图像，其中，所述偏移量矩阵用于指示在第二卷积时的卷积位置的偏移量；融合所述第一特征图像和所述第二特征图像，生成目标特征...

【技术保护点】

【技术特征摘要】
1.一种文本区域检测方法，包括：获取待识别图像；对所述待识别图像进行第一卷积，生成第一特征图像，以及，根据所述第一特征图像预测得到包含偏移量矩阵的卷积核，并采用包含偏移量矩阵的卷积核对所述待识别图像进行第二卷积，生成第二特征图像，其中，所述偏移量矩阵用于指示在第二卷积时的卷积位置的偏移量；融合所述第一特征图像和所述第二特征图像，生成目标特征图像；根据所述目标特征图像生成输出特征图像，所述输出特征图像包含区域中心点概率图，根据所述输出特征图像确定中心点的坐标值；根据所述第二特征图像确定边界点相对于所述中心点的坐标值的偏移量，根据所述偏移量和所述中心点的坐标值确定所述边界点的坐标值；根据所述边界点的坐标值确定文本区域。2.如权利要求1所述的方法，其中，对所述待识别图像进行第一卷积，生成第一特征图像，包括：采用包含多个块的基础网络模型对所述待识别图像分别进行卷积，生成对应于所述多个块的多个不同大小的第一子特征图像；对所述多个不同大小的第一子特征图像进行上采样，生成相同规格的上采样后的多个第一子特征图像；串联所述上采样后的多个第一子特征图像，生成所述第一特征图像。3.如权利要求2所述的方法，其中，根据所述第一特征图像预测得到包含偏移量矩阵的卷积核，包括：将所述多个第一子特征图像作为预设的双向长短期记忆人工神经网络的并行输入，生成对应的多个输出值；根据所述多个输出值确定所述偏移量矩阵，生成包含所述偏移量矩阵的卷积核。4.如权利要求3所述的方法，其中，采用包含偏移量矩阵的卷积核所述对所述待识别图像进行第二卷积，生成第二特征图像，包括：根据所述偏移量矩阵确定卷积时的偏移量；采用包含多个块的基础网络模型根据所述偏移量对所述待识别图像分别进行卷积，生成对应所述多个块的多个不同大小的第二子特征图像；对所述多个不同大小的第二子特征图像进行上采样，生成相同规格的上采样后的多个第二子特征图像；串联所述上采样后的多个第二子特征图像，生成所述第二特征图像。5.如权利要求1所述的方法，其中，根据所述目标特征图像生成输出特征图像，包括：对所述目标特征图像进行卷积和反卷积，生成包含与所述待识别图像相同规格的包含区域中心点概率图的输出特征图像。6.如权利要求5所述的方法，其中，根据所述...

【专利技术属性】
技术研发人员：周宏浩，秦勇，
申请(专利权)人：北京世纪好未来教育科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人