文字行提取方法和装置制造方法及图纸

技术编号:5342045 阅读:244 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种文字行提取方法和装置,属于光学字符识别领域。包括:对全景二值图像的各连通域统计,得到字符宽度和字符高度,根据字符宽度和字符高度对各连通域合并;将得到各第一尺度块间的参考水平间距,根据参考水平间距将各第一尺度块合并;将得到各第二尺度块间的第二参考水平间距,根据第二参考水平间距将各第二尺度块合并;将得到的第三尺度块排序后将第三尺度块左右两端既定数目的第一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。本发明专利技术分别对应字符、单词和词段进行多尺度合并,再以得到的文字行为基础自顶向下将被排除的尺度块添加回文字行中,减少了不完整字符对文字行提取的干扰,保证了得到的文字行的有效性和准确性。

【技术实现步骤摘要】

本专利技术属于光学字符识别领域,特别涉及一种文字行提取方法和装置
技术介绍
电子扫描笔(简称扫描笔)是OCR的重要应用之一。扫描笔的技术原理为首先,光 学摄像头按照一定频率对被扫描资料进行连续拍照,获取被扫资料的图像序列,然后将图 像序列拼接成一幅全景二值图像,最后在得到的全景图像中提取待识别文字行并进行OCR 识别。文字行提取有多种方法,大体分为自顶向下、自底向上以及自顶向下自底向上两 者相结合三种,但这些方法多是针对印刷体文档或者手写文本的,对于扫描笔获取的全景 二值图像处理效果不好。这是因为扫描笔获取的全景二值图像具有其自身的不同于印刷体 文档及手写文本的特点(1)图像内的文字行很少,图像内的字符存在不完整的情况,故得 到的图像不利于信息统计,使部分自底向上的方法失效;(2)图像的文字行形状多变,有可 能是倾斜的,甚至是弯曲的,使部分自顶向下的方法失效。为此,需要一种专门针对扫描笔 获取的全景二值图像的文字行提取方法。
技术实现思路
本专利技术所要解决的问题为提供一种文字行提取方法和装置,利用全景二值图像的 特点去除图像中的不完整字符,有效减小了不完整字符对合并的干扰,然后采用一种自底 向上和自顶向下相结合的方法实现文字行提取。本方法公开了一种文字行提取方法,包括如下步骤步骤一对全景二值图像中的各连通域进行统计,得到字符宽度和字符高度,根据字符 宽度和字符高度对各连通域进行合并,得到第一尺度块;步骤二 将得到的第一尺度块进行排序,得到各第一尺度块间的参考水平间距,根据参 考水平间距将各第一尺度块进行合并得到第二尺度块;步骤三将得到的第二尺度块进行排序,得到各第二尺度块间的第二参考水平间距,根 据第二参考水平间距将各第二尺度块进行合并得到第三尺度块;步骤四将得到的第三尺度块进行排序,排序后将第三尺度块左右两端既定数目的第 一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。所述步骤一之前还包括步骤a:标记全景二值图像中的连通域,统计各连通域的高度得到全景二值图像中的 平均字符高;步骤b 去除全景二值图像边缘处高度小于平均字符高既定比例的连通域。所述步骤一中对全景二值图像中的各连通域进行统计时,按各连通域的宽度值统 计对应的连通域个数,按宽度值从大到小的顺序将其对应的连通域个数加和,取加和大于 等于连通域总数的五分之一时对应的宽度值作为字符宽度。所述步骤一中对全景二值图像中的各连通域进行统计时,按各连通域的高度值统 计对应的连通域个数,按高度值从大到小的顺序将其对应的连通域个数加和,取加和值大 于等于连通域总数的五分之一时对应的高度值作为字符高度。所述步骤一之后还包括去除小于字符高度二分之一的第一尺度块。所述步骤二的参考水平间距为两相邻的第一尺度块间的水平间距的中值。所述步骤二中将各第一尺度块进行合并得到第二尺度块时,依次遍历各第一尺度 块,将未经合并的当前第一尺度块作为第二尺度块,并将满足既定条件的未经合并的第一 尺度块合并到所述第二尺度块。所述既定条件为第二尺度块与相邻的第一尺度块在竖直方向有交叠,且交叠高度 大于等于两者中高度较小者的三分之一,且第二尺度块与相邻的第一尺度块的水平间距小 于等于2倍参考水平间距且大于等于负的字符宽度的三分之一。所述步骤三的第二参考水平间距为两相邻的第二尺度块间的小于2倍字符宽度 的水平间距的中值。所述步骤三中将各第二尺度块进行合并得到第三尺度块时,依次遍历各第二尺度 块,将未经合并的当前第二尺度块作为第三尺度块,并将满足第二既定条件的未经合并的 第二尺度块合并到所述第三尺度块。所述第二既定条件为第三尺度块与相邻的第二尺度块在竖直方向有既定高度的 交叠;且第三尺度块与相邻的第二尺度块的水平间距大于零、小于等于2倍第二参考水平 间距。所述步骤三还包括对得到的第三尺度块进行验证,如果与当前第二尺度块相邻 的、与合并方向相反的第二尺度块和当前第二尺度块在竖直方向有高度大于既定高度的交 叠,且两相邻的第二尺度块的水平间距不大于2倍水平间距,则当前第二尺度块不能合并 至第三尺度块中,当前第三尺度块结束合并。所述步骤四中的延长线分别由位于第三尺度块中最左侧既定数目的第一尺度块 和最右侧的既定数目的第一尺度块生成,通过提取各第一尺度块的中心点坐标用最小二乘 法拟合得到。所述步骤四中的既定数目为三个及三个以上。所述步骤四中将第三尺度块根据延长线合并为文字行包括依次遍历含有既定数 目的第一尺度块的各第三尺度块,将未经合并的当前第三尺度块作为文字行,把满足第三 既定条件的未经合并的第三尺度块合并到所述文字行。所述第三既定条件为文字行的延长线穿过当前第三尺度块中与文字行距离最近 的第一尺度块,且当前第三尺度块与文字行的水平间距小于4倍字符宽度。所述步骤四之后还包括将小于字符高度二分之一的第一尺度块添加至文字行。所述小于字符高度二分之一的第一尺度块添加至文字行时,将文字行中连接相邻 的第一尺度块的中心点的线段分别向上和向下平移二分之一的字符高度,所得线段之间的 区域作为有效区域,在有效区域内的第一尺度块添加至文字行。本专利技术还公开了一种文字行提取装置,包括如下模块统计模块对全景二值图像中的各连通域进行统计,得到字符宽度和字符高度,根据字 符宽度和字符高度对各连通域进行合并,得到第一尺度块;第一合并模块将得到的第一尺度块进行排序,得到各第一尺度块间的参考水平间距, 根据参考水平间距将各第一尺度块进行合并得到第二尺度块;第二合并模块将得到的第二尺度块进行排序,得到各第二尺度块间的第二参考水平 间距,根据第二参考水平间距将各第二尺度块进行合并得到第三尺度块;第三合并模块将得到的第三尺度块进行排序,排序后将第三尺度块左右两端既定数 目的第一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。本专利技术文字行提取方法和装置,充分利用了全景二值图像的特点,分别对应字符、 单词和词段的概念进行多尺度合并,再以得到的文字行为基础自顶向下将被排除的尺度块 添加回文字行中,以得到完整的文字行。本方法减少了不完整字符对文字行提取的干扰,保 证了得到的文字行的有效性和准确性;采用自底向上和自顶向下相结合的方法处理文字行 倾斜或弯曲的情况,保证了得到的文字行的完整性。附图说明图1为本专利技术文字行提取方法的一个实施例的流程图。图2为本专利技术文字行提取方法中的步骤105的一个实施例流程图。图3为本专利技术实施例之一的全景二值图像。图4为本专利技术实施例之一的步骤101的连通域标记结果示意图。图5为本专利技术实施例之一的全景二值图像的上下边缘示意图。图6为本专利技术实施例之一的步骤103的去掉贴边的小连通域后的剩余连通域的示 意图。图7为本专利技术实施例之一的步骤104的合并连通域得到的第一尺度块的示意图。图8为本专利技术实施例之一的步骤105的去掉较小第一尺度块后的剩余第一尺度块 的示意图。图9为本专利技术实施例之一的步骤106的合并第一尺度块得到的第二尺度块的示意 图。图10为本专利技术实施例之一的步骤107的合并第二尺度块得到的第三尺度块的示意图。图11为本专利技术实施例之一的步骤107中的一种合并终止情况的示意图。图12为本专利技术实施例之一的步骤107中的一种合并终止情况的示意图。图13为本专利技术实施例之一的步骤108的合并第三尺度块得到的文字行本文档来自技高网...

【技术保护点】
一种文字行提取方法,其特征在于,包括如下步骤:步骤一:对全景二值图像中的各连通域进行统计,得到字符宽度和字符高度,根据字符宽度和字符高度对各连通域进行合并,得到第一尺度块;步骤二:将得到的第一尺度块进行排序,得到各第一尺度块间的参考水平间距,根据参考水平间距将各第一尺度块进行合并得到第二尺度块;步骤三:将得到的第二尺度块进行排序,得到各第二尺度块间的第二参考水平间距,根据第二参考水平间距将各第二尺度块进行合并得到第三尺度块;步骤四:将得到的第三尺度块进行排序,排序后将第三尺度块左右两端既定数目的第一尺度块作延长线,根据延长线将各第三尺度块合并为文字行。

【技术特征摘要】

【专利技术属性】
技术研发人员:李永彬
申请(专利权)人:汉王科技股份有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1