【技术实现步骤摘要】
一种文字检测方法及装置、设备和计算机可读存储介质
本申请涉及文字检测
,尤其涉及一种文字检测方法及装置、设备和计算机可读存储介质。
技术介绍
目前,在很多应用领域中存在文字检测需求,而且希望文字检测既快速又准确,而且文字检测设备的功耗又低。现有技术中的文字检测技术主要包括:基于传统计算机视觉的文字检测,以及基于人工智能的深度学习文字检测。但是,在实际应用中,基于传统计算机视觉的文字检测方式受到光线、噪点、背景图片等因素的影响,文字检测和识别的准确率很低;而基于人工智能的深度学习文字检测方式虽然大部分情况下文字检测和识别的准确率较高,但是其运行对硬件资源要求高、运行速度较慢、功耗高,而且文字检测设备需要有图像处理单元(GPU)的支持,然而诸如手机、智能眼镜等便携式电子设备上的硬件资源有限且电池容量有限,使得深度学习文字检测在便携式电子设备上运行的难度较大,用户体验很差。因此,需要一种运行速度快、功耗低、准确率高的文字检测方式,其尤适合于在便携式电子设备上运行。
技术实现思路
本申请实施例提供一种用于文字检测方法和装置、设备和计算机可读存储介质,用以解决现有技术中的如下技术问题:现有文字检测方式受到光线、噪点、背景图片等因素的影响,文字检测和识别的准确率很低,或者对硬件资源要求高、运行速度较慢、功耗高。本申请实施例采用下述技术方案:一种文字检测方法,包括:获取待检测图像,并将待检测图像转换为灰度图;将灰度图通过二值化转换成二值图像;对二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将待检测图像中的、与所述轮廓对应的区域确定为文 ...
【技术保护点】
1.一种文字检测方法,其特征在于,包括:获取待检测图像,并将所述待检测图像转换为灰度图;将所述灰度图通过二值化转换成二值图像;对所述二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。
【技术特征摘要】
1.一种文字检测方法,其特征在于,包括:获取待检测图像,并将所述待检测图像转换为灰度图;将所述灰度图通过二值化转换成二值图像;对所述二值图像进行形态变换;获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。2.如权利要求1所述的文字检测方法,其特征在于,所述将所述灰度图通过二值化转换成二值图像包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将所述平均像素灰度值减去预设的灰度差值而得到自适应比较灰度阈值,将该像素的灰度值与所述自适应比较灰度阈值比较,如果该像素的灰度值大于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极大值,如果该像素的灰度值小于或等于所述自适应比较灰度阈值,则将该像素的灰度值重新设为灰度极小值,从而得到所述二值图像。3.如权利要求1或2所述的文字检测方法,其特征在于,在对所述二值图像进行形态变换之前,所述方法还包括对所述二值图像进行颜色反转操作,并且所述对所述二值图像进行形态变换包括:对所述二值图像依次进行膨胀操作和腐蚀操作。4.如权利要求1或2所述的文字检测方法,其特征在于,所述对所述二值图像进行形态变换包括:对所述二值图像依次进行腐蚀操作和膨胀操作。5.如权利要求3所述的文字检测方法,其特征在于,在对所述二值图像进行颜色反转操作之后、进行膨胀操作之前,所述方法还包括:对所述二值图像进行腐蚀操作以去除所述二值图像中的噪声;或者,其特征在于,所述方法还包括:在对所述二值图像进行颜色反转操作之前,对所述二值图像进行膨胀操作以去除所述二值图像中的噪声。6.如权利要求4所述的文字检测方法,其特征在于,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像进行膨胀操作以去除所述二值图像中的噪声;或者,其特征在于,在对所述二值图像进行腐蚀操作之前,所述方法还包括:对所述二值图像依次进行颜色反转操作、腐蚀操作以去除所述二值图像中的噪声、以及颜色反转操作。7.如权利要求1-6中任一项所述的文字检测方法,其特征在于,在获取所述轮廓之后,在将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域之前,所述方法还包括:去除所述轮廓中符合预设条件的至少一个所述轮廓。8.根据权利要求1-7中任一项所述的文字检测方法,其特征在于,还包括:在所有所述轮廓中保留与所述待检测图像中被预设颜色包围的位置内的轮廓。9.根据权利要求1-8中任一项所述的文字检测方法,其特征在于,还包括:按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域。10.根据权利要求9所述的文字检测方法,其特征在于,所述按照文字版面分布规则对所述轮廓或确定出的文字检测区域进行聚类操作从而选出目标轮廓或文字检测区域包括以下中的至少一者:排除位于版面边缘的轮廓或文字检测区域;和/或选择文字最多的区域。11.根据权利要求1-3和5中任一项所述的文字检测方法,其特征在于,通过二值化转换得到的所述二值图像为黑白图像,所述黑白图像中的黑色区域表示所述有文字部分的颜色区域。12.一种文字检测装置,其特征在于,包括:图像获取模块,用于获取待检测图像;图像处理模块,其用于将所述待检测图像转换为灰度图,将所述灰度图通过二值化转换成二值图像,并且对所述二值图像进行形态变换;确定模块,用于获取经形态变换后二值图像中表示有文字部分的颜色区域的轮廓,将所述待检测图像中的、与所述轮廓对应的区域确定为文字检测区域。13.如权利要求12所述的文字检测装置,其特征在于,所述将所述灰度图通过二值化转换成二值图像包括:对于所述灰度图中的每个像素,计算出以该像素为中心的像素块的平均像素灰度值并将...
【专利技术属性】
技术研发人员:梅嵩,蔡海蛟,冯歆鹏,周骥,
申请(专利权)人:上海肇观电子科技有限公司,昆山肇观电子科技有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。