一种文字检测方法及装置、设备和计算机可读存储介质制造方法及图纸

技术编号:21799966 阅读:22 留言:0更新日期:2019-08-07 10:43
本申请公开了一种文字检测方法及装置,该方法包括:获取待检测图像,并将所述待检测图像转换为灰度图;将所述灰度图通过二值化转换成二值图像;对所述二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。利用该方法,能够提高文字检测速度、提高文字检测准确性、改善用户体验。还公开了相应的设备和计算机可读存储介质。

A Text Detection Method and Device, Equipment and Computer Readable Storage Media

【技术实现步骤摘要】
一种文字检测方法及装置、设备和计算机可读存储介质
本申请涉及文字检测
,尤其涉及一种文字检测方法及装置、设备和计算机可读存储介质。
技术介绍
目前,在很多应用领域中存在文字检测需求,而且希望文字检测既快速又准确,而且文字检测设备的功耗又低。现有技术中的文字检测技术主要包括:基于传统计算机视觉的文字检测,以及基于人工智能的深度学习文字检测。但是,在实际应用中,基于传统计算机视觉的文字检测方式受到光线、噪点、背景图片等因素的影响,文字检测和识别的准确率很低;而基于人工智能的深度学习文字检测方式虽然大部分情况下文字检测和识别的准确率较高,但是其运行对硬件资源要求高、运行速度较慢、功耗高,而且文字检测设备需要有图像处理单元(GPU)的支持,然而诸如手机、智能眼镜等便携式电子设备上的硬件资源有限且电池容量有限,使得深度学习文字检测在便携式电子设备上运行的难度较大,用户体验很差。因此,需要一种运行速度快、功耗低、准确率高的文字检测方式,其尤适合于在便携式电子设备上运行。
技术实现思路
本申请实施例提供一种用于文字检测方法和装置、设备和计算机可读存储介质,用以解决现有技术中的如下技术问题:现有文字检测方式受到光线、噪点、背景图片等因素的影响,文字检测和识别的准确率很低,或者对硬件资源要求高、运行速度较慢、功耗高。本申请实施例采用下述技术方案:一种文字检测方法,包括:获取待检测图像,并将待检测图像转换为灰度图;将灰度图通过二值化转换成二值图像;对二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。在本专利技术中,经二值化转换所得的二值图像中表示有文字部分的颜色可以预先设定,例如使用二值图像中具有灰度极大值的像素区域表示有文字部分,或者反之,使用二值图像中具有灰度极小值的像素区域表示有文字部分。优选地,将灰度图通过二值化转换成二值图像可以包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。优选地,在对所述二值图像进行形态变换之前,所述方法还包括对所述二值图像进行颜色反转操作,并且对所述二值图像进行形态变换可以包括:对所述二值图像依次进行膨胀操作和腐蚀操作,这里先进行膨胀操作后进行腐蚀操作有助于使得二值图像中表示有文字部分的颜色区域尽可能地接合在一起。优选地,对所述二值图像进行形态变换可以包括:对所述二值图像依次进行腐蚀操作和膨胀操作,这有助于使得二值图像中表示有文字部分的颜色区域尽可能地接合在一起。优选地,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,所述方法还可以包括:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声。或者,所述方法还可以包括:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。优选地,在对所述二值图像进行腐蚀操作之前,所述方法还可以包括:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。或者,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。优选地,在获取所述轮廓之后,在将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述方法还可以包括:去除所述轮廓中符合预设条件的至少一个所述轮廓。优选地,所述方法还可以包括:在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。例如,考虑到书本、报纸等纸张印刷品的文字背景主要为白色、黄色等,所以可以通过保留这些背景颜色内的所述轮廓而去除其它位置的轮廓来进一步去除干扰区域而更加精确地定位用户期望的目标文字检测区域。优选地,所述方法还可以包括:按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。优选地,按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。优选地,通过二值化转换得到的二值图像可以为黑白图像,该黑白图像中的黑色区域可以表示有文字部分的颜色区域。当然,在所得黑白图像中为白色区域表示有文字部分的颜色区域的情况下,只要将该黑白图像进行颜色反转操作后,本专利技术的各种技术方案对其同样适用。另外,还提供了一种文字检测装置,包括:图像获取模块,用于获取待检测图像;图像处理模块,其用于将所述待检测图像转换为灰度图,将所述灰度图通过二值化转换成二值图像,并且对所述二值图像进行形态变换;确定模块,用于获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。优选地,将所述灰度图通过二值化转换成二值图像可以包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。优选地,所述图像处理模块在对所述二值图像进行形态变换之前,还用于对所述二值图像进行颜色反转操作,并且对所述二值图像进行形态变换可以包括:对所述二值图像依次进行膨胀操作和腐蚀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。优选地,对所述二值图像进行形态变换也可以包括:对所述二值图像依次进行腐蚀操作和膨胀操作,使得有助于二值图像中表示有文字部分的颜色区域尽可能地接合在一起。优选地,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,图像处理模块还可以用于:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声。或者所述图像处理模块还用于:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。优选地,在对所述二值图像进行腐蚀操作之前,图像处理模块还可以用于:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。或者,在对所述二值图像进行腐蚀操作之前,所述图像处理模块还用于:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。可选地,在获取所述轮廓之后,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,确定模块还可以用于:去除所述轮廓中符合预设条件的至少一个所述轮廓。可选地,确定模块还可以用于:在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。可选地,确定模块还可以用于:按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标本文档来自技高网...

【技术保护点】
1.一种文字检测方法,其特征在于,包括:获取待检测图像,并将所述待检测图像转换为灰度图;将所述灰度图通过二值化转换成二值图像;对所述二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。

【技术特征摘要】
1.一种文字检测方法,其特征在于,包括:获取待检测图像,并将所述待检测图像转换为灰度图;将所述灰度图通过二值化转换成二值图像;对所述二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。2.如权利要求1所述的文字检测方法,其特征在于,所述将所述灰度图通过二值化转换成二值图像包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。3.如权利要求1或2所述的文字检测方法,其特征在于,在对所述二值图像进行形态变换之前,所述方法还包括对所述二值图像进行颜色反转操作,并且所述对所述二值图像进行形态变换包括:对所述二值图像依次进行膨胀操作和腐蚀操作。4.如权利要求1或2所述的文字检测方法,其特征在于,所述对所述二值图像进行形态变换包括:对所述二值图像依次进行腐蚀操作和膨胀操作。5.如权利要求3所述的文字检测方法,其特征在于,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,所述方法还包括:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声;或者,其特征在于,所述方法还包括:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。6.如权利要求4所述的文字检测方法,其特征在于,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声;或者,其特征在于,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。7.如权利要求1-6中任一项所述的文字检测方法,其特征在于,在获取所述轮廓之后,在将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述方法还包括:去除所述轮廓中符合预设条件的至少一个所述轮廓。8.根据权利要求1-7中任一项所述的文字检测方法,其特征在于,还包括:在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。9.根据权利要求1-8中任一项所述的文字检测方法,其特征在于,还包括:按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。10.根据权利要求9所述的文字检测方法,其特征在于,所述按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。11.根据权利要求1-3和5中任一项所述的文字检测方法,其特征在于,通过二值化转换得到的所述二值图像为黑白图像,所述黑白图像中的黑色区域表示所述有文字部分的颜色区域。12.一种文字检测装置,其特征在于,包括:图像获取模块,用于获取待检测图像;图像处理模块,其用于将所述待检测图像转换为灰度图,将所述灰度图通过二值化转换成二值图像,并且对所述二值图像进行形态变换;确定模块,用于获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。13.如权利要求12所述的文字检测装置,其特征在于,所述将所述灰度图通过二值化转换成二值图像包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将...

【专利技术属性】
技术研发人员:梅嵩蔡海蛟冯歆鹏周骥
申请(专利权)人:上海肇观电子科技有限公司昆山肇观电子科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1