一种基于文本边界的中文文档图像畸变校正方法技术

技术编号：6874217 阅读：415 留言：0更新日期：2012-04-11 18:40

本发明专利技术公开了一种基于文本边界的中文文档图像畸变校正方法，包括1)对扫描获取的文档图像进行预处理，去除页面边界及边界以外区域的干扰；2)判断文档图像的畸变方向，确定畸变区域；3)对文档图像进行二值化；4)提取经二值化的文档图像的上下文本边界线；5)根据上下文本边界线，采用线性插值方法对文档图像中畸变区域进行变换，得到校正的图像；本发明专利技术解决了扫描获取的中文文档图像的畸变校正问题，根据中文特征提取文本边界线进行校正的方法，降低了计算复杂度的同时，有效解决了复杂结构文档图像的校正。同时本方法与采集设备无关，不依赖于设备参数，具有广泛的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于文档图像处理技术，尤其涉及基于文本边界的文档图像畸变校正方法，具体涉及到了经扫描获取的中文文档图像的线性畸变和非线性畸变的校正方法。
技术介绍
随着信息技术的发展和办公自动化的普及，越来越多的文档需要转成电子形式，扫描是一种基本的方式。在这个过程中，由于装订的影响，难以避免地会造成图像存在一定程度上的畸变，这种畸变往往是线性畸变和非线性畸变的叠加。加之，现在的文档经常是包含大量表格、图像等非文本内容的复杂结构文档，使得文档图像的畸变校正变得十分困难。现有的文档图像畸变校正方法主要分为两类，一类是依赖于3D的扫描设备，通过三维扫描仪获取的图像带有深度信息，可以建立原始文本的畸变模型，通过几何变换来校正图像。由于三维扫描仪价格昂贵，目前还没有被广泛使用，限制了此类方法的应用。另外一类是基于文本的方法，单纯从扫描获取的2D图像获取信息进行畸变校正。这类方法通常是针对特定文字设计的，如英文等。校正过程大致分为两步，首先得到各个字母的重心，然后同一单词的各个字母的重心相连得到中心线。然后，校正的过程就是改变各个字母的位置使得同一单词的字母重心处于同一水平线上。由于中文是由字而非单词组成，每个字由交错的笔画组成而非孤立的字母组成；另外，由于很多中文字由左右或上下两个不相连的部分组成，不同于英文字母，主体部分都是连通的，可以找到每个字母的重心，并且根据字母之间的距离可以准确划分出单词。对于中文来讲，并不能通过连通性来获得单个字的重心。因此，这类方法对中文文档图像的校正得不到较好的效果，甚至失效。在这种背景下，为适应现代化文档图像处理系统的需要，研究和...

【技术保护点】
１．一种基于文本边界的中文文档图像畸变校正方法，包括如下步骤：１）对扫描获取的文档图像进行预处理，去除页面边界及边界以外区域的干扰；２）判断文档图像的畸变方向，确定畸变区域；３）对文档图像进行二值化；４）提取经二值化处理的文档图像的上下文本边界线；５）根据上下文本边界线，采用线性插值方法对文档图像中畸变区域进行变换，得到校正的图像。

【技术特征摘要】

【专利技术属性】
技术研发人员：刘宏，丁润伟，
申请(专利权)人：北京大学，
类型：发明
国别省市：11

全部详细技术资料下载我是这个专利的主人