本发明专利技术涉及文档电子处理范畴,提供了一种基于内容的文档图像倾斜角估计方法,本方法首先对获取的文档图像进行二值化处理;接着使用直线段检测方法获取图像中的各直线段,当判定没有直线段时,采用文本行检测算法分别定位各文本行的中心线位置来获取直线段;同时,采用投票算法分别统计各直线段倾斜角度的分布情况,并用高斯小波变换的突变信号检测方法计算出各直线段的倾斜角;最后,使用各直线段倾斜角在文档图像倾斜角中所占的权重计算出文档的倾斜角。本发明专利技术利用直线段或文字行来估计文档图像倾斜角度,不但能估计含有直线段的文档图像倾斜角,也能够估计没有直线段的文档图像倾斜角度,通用性好、稳定性好且精度高。
【技术实现步骤摘要】
本专利技术涉及文档电子测量处理范畴,特别是一种文档图像倾斜角测量的估计方法,具体是。
技术介绍
文档作为信息的载体,在社会生活中占有着十分重要的地位,其可以通过扫描仪、 数码相机或文档处理系统进入计算机,转化为文档图像或者电子文档,从而使人们能够方便有效地对其进行存储、管理、传输。现实生活中,由于扫描仪等走纸设备的机械误差或人为因素的影响,获取到的文档图像通常会出现某种程度的倾斜。而文档处理系统要求的处理对象是工整的,或者倾斜角度已知的文档图像,否则对图像的许多操作,如投影分析、图像分割等就无法进行。因此,倾斜角检测是文档图像处理中非常重要的组成部分,是图像分析、识别的基础,特别是在光标字符识别实时系统中,识别的性能直接和图像数据的质量相关。因此充分利用现有的图像处理手段,解决文档图像扫描过程的倾斜问题,在提高文档信息采集,录入准确性、减少拒识率,提高产品的易操作性和可靠性方面具有重要的研究意义。目前,文档图像倾斜校正方法主要可分为三类投影方法、Hough变换法和近邻法,此外还有矩形块邻接图算法、基于子空间直线段检测法、基于梯度分析法、神经网络法坐寸ο而大多数图像识别技术中使用的倾斜校正方法的计算精度在很大程度上受图像纹理的影响,又文档种类繁多且版面十分复杂,包含文字、表格、图像、图形等,通用的文档图像倾斜角估计方法很难建立。文献《基于内容的文档图像倾斜校正》中公布了一种文档图像倾斜角估计方法,但其对文档图像采用游长平滑预处理,使文字行连成一个连通的区域,这种方式在检测直线段时只能检测表格对应的直线段,通用性不强;且其选用文档中的最长线段为有效直线段进行文档图像倾斜角的估算,保证了计算速度的同时却降低了其准确度。此为现有技术的不足之处。
技术实现思路
本专利技术所要解决的技术问题,就是针对现有技术所存在的不足,提供一种不但能够估计有直线段的文档图像倾斜角,还能估计没有直线段的文档图像的倾斜角,并精度高、 稳定性好且通用性强的文档图像倾斜角估计方法。本专利技术的技术解决方案是,步骤如下(I)获取文档图像; (2)对文档图像进行二值化;(3)用直线段检测方法检测二值化图像中各直线段;(4)用细化算法细化步骤(3)中得到的各直线段;(5)设定阈值,用8连通域标记方法标记细化后的各直线段,并判断文档图像中是否存在有效直线段,若存在直线段长度大于或等于给定阈值的直线段,则相应的直线段为有效直线段,保留各有效直线段,并转至执行步骤(9),否则继续向下执行步骤(6);(6)使用平滑算法平滑该文档图像;(7)用高斯二阶导数函数的小波变换确定平滑文档图像的各文本行中心线;(8)设定阈值,用8连通域标记方法标记文本行中心线,并判断文档图像中是否存在有效中心线,若存在中心线长度大于或等于给定阈值的中心线,则相应的中心线为有效中心线,保留各有效中心线,继续执行步骤(9),否则转至步骤(11);(9)用投票算法统计各有效直线段或/有效中心线的倾斜角度分布函数;(10)用高斯小波变换的突变信号检测方法进行各倾斜角度分布函数的突变信号分析;(11)计算出文档图像倾斜角。其中所述步骤(9)中的投票算法用于统计同一有效直线段或/有效中心线中满足给定阈值的两像素之间倾斜角度的分布情况;所述步骤(10)中的高斯小波变换的突变信号检测方法用于计算各有效直线段或/有效中心线的倾斜角度;所述步骤(11)中依据各有效直线段或/有效中心线倾斜角度在文档图像倾斜角中所占的权重计算出文档图像倾斜角,且计算公式如下权利要求1.,其特征在于包括以下步骤(1)获取文档图像;(2)对文档图像进行二值化;(3)用直线段检测方法检测二值化图像中各直线段;(4)用细化算法细化步骤(3)中得到的各直线段;(5)设定阈值,用8连通域标记方法标记细化后的各直线段,并判断文档图像中是否存在有效直线段,若存在直线段长度大于或等于给定阈值的直线段,则相应的直线段为有效直线段,保留各有效直线段,转至执行步骤(9),否则继续向下执行步骤(6);(6)使用平滑算法平滑该文档图像;(7)用高斯二阶导数函数的小波变换确定平滑文档图像的各文本行中心线;(8)设定阈值,用8连通域标记方法标记文本行中心线,并判断文档图像中是否存在有效中心线,若存在中心线长度大于或等于给定阈值的中心线,则相应的中心线为有效中心线,保留各有效中心线,继续执行步骤(9),否则转至步骤(11);(9)用投票算法统计各有效直线段或/有效中心线的倾斜角度分布函数;(10)用高斯小波变换的突变信号检测方法进行各倾斜角度分布函数的突变信号分析;(11)计算出文档图像倾斜角。2.根据权利要求I所述的基于内容的文档图像倾斜角估计方法,其特征是所述步骤 (5)与步骤⑶中给定的阈值为32个像素。3.根据权利要求I所述的基于内容的文档图像倾斜角估计方法,其特征是所述步骤 (5)与步骤⑶中给定的阈值为48个像素。4.根据权利要求I所述的基于内容的文档图像倾斜角估计方法,其特征是所述步骤(5)与步骤⑶中给定的阈值为64个像素。5.根据权利要求I所述的基于内容的文档图像倾斜角估计方法,其特征是所述步骤(9)中的投票算法,用于统计同一有效直线段或/有效中心线中满足给定阈值的两像素之间倾斜角度的分布情况。6.根据权利要求5所述的基于内容的文档图像倾斜角估计方法,其特征是所述给定的阈值为16个像素。7.根据权利要求I所述的基于内容的文档图像倾斜角估计方法,其特征是所述步骤(10)中的高斯小波变换的突变信号检测方法用于计算各有效直线段或/有效中心线的倾斜角度。8.根据权利要求I所述的基于内容的文档图像倾斜角估计方法,其特征是所述步骤(11)中依据各有效直线段或/有效中心线倾斜角度在文档图像倾斜角中所占的权重计算出文档图像倾斜角,且计算公式如下全文摘要本专利技术涉及文档电子处理范畴,提供了,本方法首先对获取的文档图像进行二值化处理;接着使用直线段检测方法获取图像中的各直线段,当判定没有直线段时,采用文本行检测算法分别定位各文本行的中心线位置来获取直线段;同时,采用投票算法分别统计各直线段倾斜角度的分布情况,并用高斯小波变换的突变信号检测方法计算出各直线段的倾斜角;最后,使用各直线段倾斜角在文档图像倾斜角中所占的权重计算出文档的倾斜角。本专利技术利用直线段或文字行来估计文档图像倾斜角度,不但能估计含有直线段的文档图像倾斜角,也能够估计没有直线段的文档图像倾斜角度,通用性好、稳定性好且精度高。文档编号G06K9/32GK102938062SQ20121039145公开日2013年2月20日 申请日期2012年10月16日 优先权日2012年10月16日专利技术者马磊, 刘江, 陈霞 申请人:山东山大鸥玛软件有限公司本文档来自技高网...
【技术保护点】
一种基于内容的文档图像倾斜角估计方法,其特征在于包括以下步骤:(1)获取文档图像;(2)对文档图像进行二值化;(3)用直线段检测方法检测二值化图像中各直线段;(4)用细化算法细化步骤(3)中得到的各直线段;(5)设定阈值,用8连通域标记方法标记细化后的各直线段,并判断文档图像中是否存在有效直线段,若存在直线段长度大于或等于给定阈值的直线段,则相应的直线段为有效直线段,保留各有效直线段,转至执行步骤(9),否则继续向下执行步骤(6);(6)使用平滑算法平滑该文档图像;(7)用高斯二阶导数函数的小波变换确定平滑文档图像的各文本行中心线;(8)设定阈值,用8连通域标记方法标记文本行中心线,并判断文档图像中是否存在有效中心线,若存在中心线长度大于或等于给定阈值的中心线,则相应的中心线为有效中心线,保留各有效中心线,继续执行步骤(9),否则转至步骤(11);(9)用投票算法统计各有效直线段或/有效中心线的倾斜角度分布函数;(10)用高斯小波变换的突变信号检测方法进行各倾斜角度分布函数的突变信号分析;(11)计算出文档图像倾斜角。
【技术特征摘要】
【专利技术属性】
技术研发人员:马磊,刘江,陈霞,
申请(专利权)人:山东山大鸥玛软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。