本申请提供了一种笔画宽度提取方法、装置及一种文字识别方法、系统,以解决笔画提取准确性的问题。所述方法包括:提取笔画的原始连通分量并对应一候选笔画宽度;对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。本申请提高了笔画宽度提取的准确性,而且还提高了计算速度。
【技术实现步骤摘要】
一种笔画宽度提取方法、装置及一种文字识别方法、系统
本申请涉及文字识别
,特别是涉及一种笔画宽度提取方法及提取装置,以及,一种文字识别方法及识别系统。
技术介绍
图像中的文字识别技术有着广泛的应用,如扫描文档的内容识别、自动邮政编码识别等。随着数码相机的推广和互联网技术的发展,自然场景下的拍摄图像和人工编辑生成的图像越来越多。这些图像有复杂的背景图片,多变的前景颜色和纹理,其中的文字也有多语种、多字体、非线性排列等干扰。为了识别这些复杂图像中的文字,首先需要进行文字区域定位和切割。笔画是文字的重要特征,笔画宽度是区分文字区域和非文字区域的重要特征,笔画宽度提取的准确度对于最终文字区域定位的准确度有着很大的影响。目前较常使用的一种笔画宽度的提取方法是基于边缘扫描的方法。该方法首先对图像进行边缘提取,保留那些封闭的边缘。然后对边缘上的每一个点,沿着边缘的法向进行扫描,直到抵达另一条边缘,如果这两条边缘的法向方向相反,则扫描线的长度即为笔画的可能宽度。最后统计可能宽度的分布,占比最高的宽度就是笔画宽度。上述基于边缘扫描的方法依赖于边缘提取的准确度,如果提取的边缘出现了断裂、过分割等情况,就无法被保留。同时,微小的边缘变化会极大地改变边缘的法向方向,从而影响笔画宽度的提取。实验结果显示在复杂背景、强噪声、低分辨率等情况下,该类方法无法准确提取笔画宽度信息。
技术实现思路
本申请提供了一种笔画宽度提取方法、装置,以解决笔画提取准确性的问题。相应的,本申请还提供了一种文字识别方法、系统,以解决文字识别准确性的问题。为了解决上述问题,本申请公开了一种笔画宽度提取方法,包括:提取笔画的原始连通分量并对应一候选笔画宽度;对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。优选地,所述对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度,包括:将所述周长直方图中第n次腐蚀前的连通分量的轮廓周长减去第n+1次腐蚀前的连通分量的轮廓周长,得到第n个候选笔画宽度对应的笔画长度;其中,n为正整数。优选地,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,包括:寻找笔画宽度直方图中纵坐标表示的笔画长度的极大值,所述笔画宽度直方图中的横坐标表示笔画宽度,所述极大值对应的笔画宽度为峰值宽度;从所述极大值中选出最大值和次大值;如果所述最大值和次大值之和占笔画宽度直方图中笔画长度总长度的比例小于第一阈值,或者,最大峰值宽度与最大宽度之差超过第二阈值,则所述原始连通分量为非文字区域;否则,为文字区域。优选地,如果极大值为一个,或者次大值小于最大值的x%,则舍弃次大值;其中,x为预设值。优选地,所述依据极大值确定该文字区域的笔画宽度,包括:确定笔画宽度直方图中极大值对应的峰值宽度为m,m为正整数;计算2m或2m-1并作为该文字区域的笔画宽度;其中,如果极大值为一个,则该文字区域得到一个笔画宽度;如果极大值有两个,则该文字区域得到两个笔画宽度。优选地,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域之前,还包括:对所述笔画宽度直方图按照以下公式进行平滑操作:l′n=w1ln-1+w0ln+w1ln+1;其中,l′n表示平滑后的笔画长度,ln-1、ln、ln+1均表示平滑前的笔画长度,w0和w1表示平滑权值。优选地,所述对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,包括:选取原始连通分量的轮廓上的点作为初始点集;从初始点集开始,对原始连通分量中的每个点进行广度遍历,获得每个点距离所述初始点集的最短路径长度,并将所述最短路径长度作为该点的腐蚀次数;统计具有相同腐蚀次数n的点的个数,作为第n次腐蚀前的连通分量的轮廓周长,n为正整数。优选地,对原始连通分量中的每个点进行4邻接的广度遍历。本申请还提供了一种笔画宽度提取装置,包括:连通分量提取模块,用于提取笔画的原始连通分量并对应一候选笔画宽度;腐蚀和轮廓周长提取模块,用于对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;差分计算模块,用于每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;直方图生成模块,用于将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;笔画宽度提取模块,用于依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。优选地,所述差分计算模块将所述周长直方图中第n次腐蚀前的连通分量的轮廓周长减去第n+1次腐蚀前的连通分量的轮廓周长,得到第n个候选笔画宽度对应的笔画长度;其中,n为正整数。优选地,所述笔画宽度提取模块包括:极大值确定子模块,用于寻找笔画宽度直方图中纵坐标表示的笔画长度的极大值,所述笔画宽度直方图中的横坐标表示笔画宽度,所述极大值对应的笔画宽度为峰值宽度;筛选子模块,用于从所述极大值中选出最大值和次大值;文字区域识别子模块,用于如果所述最大值和次大值之和占笔画宽度直方图中笔画长度总长度的比例小于第一阈值,或者,最大峰值宽度与最大宽度之差超过第二阈值,则所述原始连通分量为非文字区域;否则,为文字区域。优选地,所述笔画宽度提取模块还包括:峰值宽度确定子模块,用于确定笔画宽度直方图中极大值对应的峰值宽度为m,m为正整数;笔画宽度计算子模块,用于计算2m或2m-1并作为该文字区域的笔画宽度;其中,如果极大值为一个,则该文字区域得到一个笔画宽度;如果极大值有两个,则该文字区域得到两个笔画宽度。优选地,所述腐蚀和轮廓周长提取模块包括:初始点集选取子模块,用于选取原始连通分量的轮廓上的点作为初始点集;遍历子模块,用于从初始点集开始,对原始连通分量中的每个点进行广度遍历,获得每个点距离所述原始连通分量的轮廓边界的最短路径长度,并将所述最短路径长度作为该点的腐蚀次数;统计子模块,用于统计具有相同腐蚀次数n的点的个数,作为第n次腐蚀前的连通分量的轮廓周长,n为正整数。本申请还提供了一种文字识别方法,根据上述笔画宽度提取方法提取笔画宽度,得到笔画,然后进行文字识别。本申请还提供了一种文字识别系统,包括上述笔画宽度提取装置,用于提取笔画宽度,还包括:文字识别装置,用于根据提取的笔画宽度,得到笔画,然后进行文字识别。与现有技术相比,本申请包括以下优点:首先,本申请提供了一种基于腐蚀的笔画宽度提取方法,该方法提取每次腐蚀前的连通分量的轮廓周长组成周长直方图,并通过对周长直方图的差分计算笔画长度,由笔画长度组成笔画宽度直方图,通过对笔画宽度直方图中极大值的分析,识别出是否为文字区域,进而提取出该文字区域的笔画宽度。所述方法通过计算每次腐蚀后的轮廓周长的差值,减少了边缘噪声对笔画宽度提取的影响,从而提高了笔画宽度提取的准确性。其次,本申请采用了本文档来自技高网...
【技术保护点】
一种笔画宽度提取方法,其特征在于,包括:提取笔画的原始连通分量并对应一候选笔画宽度;对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。
【技术特征摘要】
1.一种笔画宽度提取方法,其特征在于,包括:提取笔画的原始连通分量并对应一候选笔画宽度;对所述原始连通分量进行腐蚀计算,并计算每次腐蚀前的连通分量的轮廓周长,组成周长直方图;每次腐蚀计算后得到的连通分量对应一候选笔画宽度,对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度;将各候选笔画宽度对应的笔画长度组成笔画宽度直方图;依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,如果是文字区域,则依据极大值确定该文字区域的笔画宽度。2.根据权利要求1所述的方法,其特征在于,所述对所述周长直方图进行差分计算,得到各候选笔画宽度对应的笔画长度,包括:将所述周长直方图中第n次腐蚀前的连通分量的轮廓周长减去第n+1次腐蚀前的连通分量的轮廓周长,得到第n个候选笔画宽度对应的笔画长度;其中,n为正整数。3.根据权利要求1或2所述的方法,其特征在于,所述依据所述笔画宽度直方图中的极大值确定所述原始连通分量是否为文字区域,包括:寻找笔画宽度直方图中纵坐标表示的笔画长度的极大值,所述笔画宽度直方图中的横坐标表示笔画宽度,所述极大值对应的笔画宽度为峰值宽度;从所述极大值中选出最大值和次大值;如果所述最大值和次大值之和占笔画宽度直方图中笔画长度总长度的比例小于第一阈值,或者,最大峰值宽度与最大宽度之差超过第二阈值,则所述原始连通分量为非文字区域;否则,为文字区域。4.根据权利要求3所述的方法,其特征在于:如果极大值为一个,或者次大值小于最大值的x%,则舍弃次大值;其中,x为预设值。5.根据权利要求3所述的方法,其特征在于,所述依据极大值确定该文字区域的笔画宽度,包括:确定笔画宽度直方图中极大值对应的峰值宽度为m,m为正整数;计算2m或2m-1并作为该文字区域的笔画宽度;其中,如果极大值为一个,则该文字区域得到一个笔画宽度;如果极大值有两个,则该文字区域得到两个笔画宽度。6.根据权利要求1所述的方法,其特征在于,所述依据所述笔画宽度直方...
【专利技术属性】
技术研发人员:郑琪,王永攀,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。