本发明专利技术涉及计算机信息领域的图像处理技术,具体涉及一种表格图像几何畸变的数字校正方法。为解决现有技术中只能有效的对畸变文本行进行校正,当文稿中出现畸形表格非文本区域时,无法进行后续识别的问题而发明专利技术。本发明专利技术所述的方法通过对表格图像进行分析,在二值化图像上搜索并分析有效表格线段,得到属于表格的采样表格线,分析、拟合采样表格线,并将其映射到目标位置,由采样表格线带动表格内部文字而很好地校正。本发明专利技术不但能准确地校正畸形表格,而且对于表格内部文字的矫正也达到很好的效果。
【技术实现步骤摘要】
本专利技术涉及计算机信息领域的图像处理技术,特别涉及一种对畸变的表格图像校正的方法。
技术介绍
畸变表格的校正是一种非常有用的图像处理技术,一般有两类校正方法一类是通过分析表格图像,得出表格倾斜角度,根据倾斜角度校正;另一类是分析表格图像,得到并拟合畸变的表格线,然后把畸变的表格线校正为直线。对于前一类,一般的做法是通过一定的方法,在图像上得到表格线的倾斜角度,作为校正的依据,比如分析得到表格线和水平直线的夹角α,然后根据tanα计算表格线上每一点的偏移量,从而进行校正。如文献“基于游程的倾斜表格图像的快速检测和校正”。对于后一类,由于对非特定畸变的表格,只通过分析表格倾斜角度来校正难度极大,所以需要分析表格畸变的特征来进行后期处理。对于将表格文稿扫描为图像而言,其目的大多是用于资料保存、文字识别(OCR)等场合。在OCR的运用中,对于扫描时已经展开的文稿或者书本,只是因放置不正而引起的表格倾斜,由于不会改变表格的直线表达,因此可以使用第一类方法解决;对于扫描时没有展开的文稿或者书本,数码相机拍摄的图像以及其它途径得到的图像,极有可能会改变表格原来的直线表达,可以用第二类方法解决这类问题。在OCR的运用中,表格区域的畸变不仅影响到美观,更会严重影响表格识别、表格内文字的行切分等图像处理的准确性,甚至使这些操作无法进行,如弯曲严重的表格基本无法进行识别,更不要说分离其内部文字并识别这些文字。因此表格校正质量的好坏,不仅影响到表格的主观质量评价,还会直接影响到对表格后续处理的环节。此外,由于在OCR运用中表格和表格内容都需要识别,因此在OCR中,不但对表格进行校正同时也要对表格内容进行校正,避免影响对表格内容的识别。表格图像的来源最常见的有两类通过扫描仪对文稿进行扫描或通过数码相机、拍照手机、摄像头等对文稿进行拍照获得。用扫描仪进行扫描时,通过将书稿拆开或展平后进行再扫描,一般可避免图像产生畸变。但在实际操作过程中,其畸变很难避免,而且其畸变的形式要复杂得多,比如弯曲的程度可能很严重。弯曲不仅发生在书籍,在其它区域也普遍存在;弯曲的方向不是只有凸或只有凹状弯曲,而是在同一条文本行中呈现多处凸凹相间的弯曲;畸变可能呈现放射性、不平行性。如图2的上部区域呈凸状弯曲,而下部呈凹状弯曲。这些现象会导致现有技术中分析表格的方法完全失效(1)由于表格线不呈直线,很难找到准确的表格直线,更不要说找倾斜角度了。(2)由于寻找表格直线不准确,则很难确定表格内容的位置,进而无法进行表格内容的识别。可见,现有技术只有对纯文本畸变图像校正,而对表格图像畸变无法校正,现有技术只处理了工整的、弯曲程度轻微或者单纯倾斜的表格图像,而无法处理弯曲程度严重的表格图像。
技术实现思路
为了克服上述缺陷,本专利技术的目的在于提出一种对几何畸变的表格图像进行数字校正的方法,即利用采样表格线校正带动表格内容进行校正。为达到上述目的,本专利技术,包括以下步骤(1)对表格图像进行二值化预处理,通过版面分析获得表格区域;(2)确定有效表格线段的最小长度,并根据该长度,在二值化表格图像的表格区域中进行搜索,得到N条有效表格线段,其中N为正整数;(3)根据有效表格线段的位置信息合并有效表格线段并形成表格线域;(4)根据所述表格线域中包含的有效表格线段信息,计算出与采样表格线域对应的采样表格线;(5)确定采样表格线要校正到的目标位置,将采样表格线映射到该目标位置;(6)表格内其他像素在采样表格线校正带动下校正。其中,所述步骤(4)具体为a)选择垂直方向上任意一条表格线域为采样表格线域或最上面和最下面的两条表格线域为采样表格线域;b)根据所述采样表格线域包含的有效表格线段信息,计算出与采样表格线域对应的采样表格线。其中,所述步骤b)具体为求出采样表格线域中有效线段集合的水平方向上的上下外轮廓,即曲线的上下沿,对每一对上下沿求平均值,得到中点,这些相邻的中点连接起来形成采样表格线域的采样表格线,若采样表格线不连续,则采用曲线拟合方式连接,其中,所述的曲线拟合方式为多项式拟合、贝塞尔曲线拟合、B样条拟合或椭圆曲线拟合。其中,在所述步骤(3)和步骤(4)之间,还有一步骤删除不满足表格线特征的表格线域及其包含的有效线段。其中,所述步骤(2)具体为有效表格线段的长度为表格图像中汉字宽度的四分之一,并根据该长度在二值化表格图像的表格区域中进行搜索,得到N条有效表格线段,其中N为正整数。其中,所述步骤(3)具体为,若有效表格线段左右并且上下相邻则合并,有效表格线段合并后形成表格线域的个数为一个或一个以上,每个表格线域具有上、下沿和宽度,表格线域是属于它的有效表格线段的集合。其中,所述步骤(5)具体为目标位置确定是采用采样表格线上每一点到水平边框的垂直距离的平均值,目标位置确定后,再将采样表格线映射到该目标位置。其中,所述步骤(6)具体为根据采样表格线拟合后的位置来定位并以平移或插值填充的方式来校正采样表格线外的区域。采用本专利技术所述的方法,原来畸变的表格图像通过使用该方法,表格被很好得校正过来,提高了表格主观质量,特别是在OCR的运用中,保证表格内容的完整性,从而对后续识别做了很好的准备,有效提高OCR的识别率。附图说明图1是本专利技术的流程图;图2是待校正的畸变表格图像;图3是图2二值化后左上角表格线的放大效果图;图4是在图3所示的效果图上搜索有效表格线段示意图;图5是在图4上求出表格线域的上下沿示意图;图6是在图5上求出表格线域的中点示意图;图7是图2校正之后的表格图像;图8是待校正的畸变表格图像;图9是图8校正之后的表格图像。具体实施例方式下面结合附图对本专利技术实施方式作进一步详细的描述。本专利技术的基本原理是首先将对表格图像进行二值化处理,通过对二值化表格图像的分析,粗略确定表格线域,取垂直方向上的最上和最下两条表格线域作为采样域,或者仅取垂直方向上任意一条表格线域作为采样域,进行表格线采样,得到与采样表格线域对应的采样表格线,然后对采样表格线做拟合和校正。表格内的其他像素在采样表格线的带动下进行校正。如图1所示,本专利技术的具体实施步骤如下1、对表格图像进行二值化处理和版面分析。对非二值化的表格图像(如图2所示),先进行表格图像的自动阈值二值化处理;对已经是二值化的图像,则无需进行二值化处理。然后对二值化图像进行版面分析,获得二值化图像中的表格区域。2、确定有效表格线段长度,在二值化的表格图像中搜索有效表格线段,获得n条有效表格线段。一般情况下,有效表格线段长度可以为表格图像中汉字宽度的四分之一,汉字的宽度可由版面分析获得,如果版面分析不能获得汉字宽度,就采用经验值,经验值为6像素左右。有效线段的搜索就是,对图像的某一行从左至右扫描,记录连续的黑像素,确定一个固定长度值,经验值为6像素左右,认为连续的黑像素长度大于等于这个固定长度值的线段为有效线段,如图4中的黑色线段就是对图3进行扫描搜索得到的7条有效线段。3、合并有效表格线段,得到一系列水平表格线域列表。按先左后右,先上后下的顺序检查分析有效表格线段,即对每一条有效表格线段,看它与前面的有效表格线段的位置关系,以确定是否需要合并(如图4、图5所示)。有效表格线段合并为表格线域的步骤如下a)创建一条表格线域,里面包含第一条有效本文档来自技高网...
【技术保护点】
一种表格图像几何畸变的数字校正方法,其特征在于,包括以下步骤:(1)对表格图像进行二值化预处理,通过版面分析获得表格区域;(2)确定有效表格线段的最小长度,并根据该长度,在二值化表格图像的表格区域中进行搜索,得到N条有效表格 线段,其中N为正整数;(3)根据有效表格线段的位置信息合并有效表格线段并形成表格线域;(4)根据所述表格线域中包含的有效表格线段信息,计算出与采样表格线域对应的采样表格线;(5)确定采样表格线要校正到的目标位置,将采 样表格线映射到该目标位置;(6)表格内其他像素在采样表格线校正带动下校正。
【技术特征摘要】
【专利技术属性】
技术研发人员:刘芝,康凯,杜鹏飞,
申请(专利权)人:北大方正集团有限公司,北京北大方正技术研究院有限公司,北京大学,
类型:发明
国别省市:11[中国|北京]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。