The invention relates to a document image plane of explicit and implicit perspective correction method based on line detection, the invention by the perspective distortion image is converted into gray image, and extract the gray image of the dominant or recessive line segment, and the corresponding segment endpoint coordinates, the establishment of X-ray image distortion restoration model, and the coordinates of the two points the line into the cost function, and through the LM algorithm to estimate the camera focal length f and rotation angle, get the homography transformation matrix H
【技术实现步骤摘要】
一种基于显性与隐性线段检测的平面文档图像透视矫正方法
本专利技术涉及一种图像处理
,尤其是一种基于显性与隐性线段检测的平面文档图像透视矫正方法。
技术介绍
纸质文档数字化加工是利用扫描仪或数码相机将纸质实体转化为数字图像进而转换成完全可编辑的数字化文档的过程,是机器视觉领域的一项重要应用。传统的纸质文档数字化加工过程中,出于效率与成本的考量,一般采用非接触式的相机拍照来实现。由于在相机成像的过程中相机与被拍摄平面文档的相对位置的变化,如相机与被拍摄平面图像的距离、角度的变化,尤其是针对大幅面的图像,通常会得到具有透视形变的数字图像,而透视矫正操作的含义就是把具有透视变形的图像通过单应变换转化为无透视形变的图像。传统的文档图像透视变形矫正一般都是基于灭点检测来实现的,即对于原本水平方向(竖直方向)的平行线在透视形变图中会相交于一点,称之为水平方向(竖直方向)的灭点。然而这种透视失真会严重影响到后续的文档图像版面分析,OCR(光学字符识别)等过程。因此如何消除文档成像的透视形变问题,尤其是在相机参数未知的情况下,仅仅根据图像的性质消除文档图像的透视形变对于文档分析与识别至关重要。目前针对平面图像的透视矫正问题的解决方法有图像边界法、低秩矩阵纹理分析法、相机标定法、深度学习法等。但是,图像边界法只针对矩形边界的文档而设计,仅考虑图像的边界作为变换信息并未考虑到图像的内容,这种方法往往会带来图像内容更严重的失真。低秩矩阵纹理分析的方法能够充分发掘图像的几何纹理特征,但是这种方法的实际效果与图像内容相关,并且计算量较大,从而直接导致图像处理速度较慢。相机标定的 ...
【技术保护点】
一种基于显性与隐性线段检测的平面文档图像透视矫正方法,包括以下步骤:S1)、通过相机采集纸质文档图片作为透视畸变图像;S2)、获取透视畸变图像的宽w和高h,通过灰度变换将透视畸变图像变换为单通道的灰度图像;S3)、通过LSD(Line Segment Detection)梯度聚类算法提取灰度图像内部的所有显性线段,并记录相应显性线段两端点的坐标,并用齐次坐标表示,若提取的显性线段数量小于4,或者不存在显性线段数,则通过自适应局部连接图(ALCM)提取文本行的隐性线段,并记录相应隐性线段的两端点的坐标,并用齐次坐标表示,如果显性线段的数量大于4,则无需再提取隐性线段,并将提取的显性线段或隐性线段存储到线段集合L={l1,l2,....li}中,其中,li={pi,qi},pi、qi为线段li两端点的坐标;S4)、对步骤S3)中提取的显性线段或隐形线段进行长度、斜率的筛选,若线段长度满足L={li|li≥5},以及斜率满足
【技术特征摘要】
1.一种基于显性与隐性线段检测的平面文档图像透视矫正方法,包括以下步骤:S1)、通过相机采集纸质文档图片作为透视畸变图像;S2)、获取透视畸变图像的宽w和高h,通过灰度变换将透视畸变图像变换为单通道的灰度图像;S3)、通过LSD(LineSegmentDetection)梯度聚类算法提取灰度图像内部的所有显性线段,并记录相应显性线段两端点的坐标,并用齐次坐标表示,若提取的显性线段数量小于4,或者不存在显性线段数,则通过自适应局部连接图(ALCM)提取文本行的隐性线段,并记录相应隐性线段的两端点的坐标,并用齐次坐标表示,如果显性线段的数量大于4,则无需再提取隐性线段,并将提取的显性线段或隐性线段存储到线段集合L={l1,l2,....li}中,其中,li={pi,qi},pi、qi为线段li两端点的坐标;S4)、对步骤S3)中提取的显性线段或隐形线段进行长度、斜率的筛选,若线段长度满足L={li|li≥5},以及斜率满足则保留该线段,否则删除该线段;S5)、根据透视畸变复原图像上任意一像素点b′=[x′,y′,0]T与其透视畸变图像上对应的像素点b=[x,y]T满足单应变换,具体如下:从而得到透视畸变复原图像到透视畸变图像的单应变换矩阵H,即:H=KR[e1e2-t]=KR{I-(t+e3)e3T},其中,λ为齐次坐标点归一化系数,为相机内部参数矩阵,R∈SO(3)为旋转矩阵...
【专利技术属性】
技术研发人员:应自炉,朱健菲,陈鹏飞,陈俊娟,甘俊英,翟懿奎,
申请(专利权)人:五邑大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。