图像自动定向的方法技术

技术编号:2942132 阅读:219 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种图像自动定向的方法及装置,为解决图像方向错乱给批量图像的文字识别带来麻烦的问题而发明专利技术。本发明专利技术一种图像自动定向的方法包括:将输入文档转换为数字图像;系统挑选出数字图像中有代表性的文字块;将得到的文字块归一化成点阵,为每个方向设定相同的初始权值,对权值排在第一位的方向不断进行点阵的试识别,并根据识别结果修改权值后,重新排列方向序列,统计识别结果判断出图像的正确方向并旋转输出。本发明专利技术一种图像自动定向的装置包括:图像输入装置、文字获取装置、归一化装置、识别定向装置、输出装置;采用这样的方法及装置后,可以自动、精确的将所有带有文字的图像旋转为正确方向。

【技术实现步骤摘要】

本专利技术属于计算机信息处理领域的图像处理技术,具体涉及一种图像的自动定向方法及装置。
技术介绍
随着数字化信息资源的建设与管理,对现有印刷品数字化的需求越来越迫切。通过扫描识别技术处理的电子文档将广泛应用于各种电于出版物、网络资源、各种大型文献资料数据库、数字化图书馆等诸多领域。面对大量的印刷品,批量扫描识别成为实施信息化建设中的重要技术手段。但是,现有技术中,对于扫描方向错乱的图像大都是人工旋转后再进行识别。这种人工干预使计算机系统自动的批量处理十分困难,效率非常低。专利号为CN200410042984.6的专利《一种已知表格的版面自动定向和定位方法》中叙述了一种版面自动定向的方法,但是只能针对特定的表格格式,应用十分有限。
技术实现思路
为了克服上述缺陷,本专利技术的目的在于提供一种图像自动定向的方法及装置,能够将带有文字的图像自动、精确的旋转到正确的方向,减少由于图像方向错乱给批量图像的文字识别带来的麻烦。为了达到上述目的,本专利技术一种图像自动定向的方法,包括以下步骤(一)将输入文档转换为数字图像,对数字图像的每一方向上设定相同的初始权值,默认其中任意一个方向的权值排在方向序列的第一位;(二)挑选出数字图像中的部分文字块;(三)取方向序列中权值排在第一位的方向,将步骤(二)中得到的文字块归一化成点阵后旋转为此方向,进行试识别,根据试识别结果调整方向权值;(四)将方向序列按权值从大至小重新排列,若权值相等,则按照试识别的时间次序将较远或是没有参加试识别的方向排在前面,统计方向序列中排在第一位的方向的参数值,所述的参数值包括此该方向上进行过试识别的总的点阵个数、识别结果好的点阵个数和识别结果差的点阵个数; (五)根据步骤(四)得到的参数,进行以下操作系统设定的需要试识别最少点阵个数为Wmin,系统设定的需要试识别最多点阵个数为Wmax,1)如果W<Wmin,则返回步骤(三);2)如果Wmin≤W<Wmax,则判断是否满足公式Wg>Wb*α,其中,所述的α为常数系数;判断结果为是,则判定排在第一位的方向为正确方向,进入步骤(六);判断结果为否,则返回步骤(三);3)如果W≥Wmax,则判断是否满足公式Wg>Wb和W>Wb*β,其中,所述的β为常数系数;判断结果为是,则判定排在第一位的方向为正确方向,进入步骤(六);判断结果为否,则判定图像的原方向为正确方向,进入步骤(六);其中,所述的W为进行过试识别的总的点阵个数,所述的Wg为识别结果好的点阵个数,所述的Wb为识别结果差的点阵个数;(六)根据步骤(五)得到的方向,将图像旋转并输出。作为本专利技术的进一步改进,所述的步骤(二)具体为通过版面分析技术找到图像中的文本区域,利用切分技术将文本区域中的每一个独立的文字切分出来,即获得文字块。作为本专利技术的进一步改进,所述的步骤(二)具体为(a)通过版面分析、切分技术或求连通域的方式获得图像的大部分文字块;(b)在获得图像的大部分文字里面,保留正方形或者接近正方形的文字块,剔除其他形状和文字不相符合的文字块,根据文字块宽或高的数值大小进行聚类,文字块数目最多的一类为图像中的文字块。作为本专利技术的进一步改进,所述的步骤(三)具体为将得到的文字块归一化为64×64点阵。作为本专利技术的进一步改进,步骤(三)包括 (A)取方向序列中权值排在第一位的方向,对未在此方向上试识别过的任意一个点阵进行试识别通过模板点匹配法进行试识别,匹配距离较小的识别结果为好,不和任何模版匹配的识别结果为差,匹配距离比较大的识别结果为不确定;(B)系统对识别结果好的权值加1,识别结果差的权值减1,识别结果为不确定的权值不变。作为本专利技术的进一步改进,如不能匹配的模版点为6个以下,则为识别结果好;如不能匹配的模版点超过14个,则为识别结果差;不匹配的模版点处于6个以上14个以下,则为识别结果不确定。作为本专利技术的进一步改进,所述的方向序列包括顺时针旋转0度、90度、180度、270度四个方向。一种图像自动定向的装置,包括图像输入装置,用于将输入的文档转换为数字图像;文字获取装置,用于挑选数字图像有代表性文字块;归一化装置,包括用于将挑选出的文字块归一化为点阵的归一化模块,用于将点阵按照从识别定向装置获得的方向信息进行旋转的旋转器模块;识别定向装置,包括用于将点阵进行试识别的识别器模块,用于根据识别结果修改权值的距离统计模块,用于设定方向的初始权值,按权值大小排列方向序列,将权值第一位的方向信息传递给归一化装置,计算方向序列排在第一位的方向上识别过的点阵个数,判断图像正确方向的方向判定模块;输出装置,用于根据判断出的正确方向旋转图像,并将图像输出。作为本专利技术的进一步改进,所述的文字获取装置包括用于获得大部分文字块的获取文字块模块;用于提取最有代表性文字块的筛选文字模块。作为本专利技术的进一步改进,所述的获取文字块模块是通过版面分析、切分技术实现或通过求取连通域的形式实现。作为本专利技术的进一步改进,所述的识别器模块通过模板点匹配法实现。采用上述的方法及装置后,由于采用了归一化装置和识别定向装置,可以将图像的文字归一化为点阵,取出有代表性的文字块在方向上进行试识别,并根据识别结果自动、精确的旋转到正确的方向,可以用于所有文字识别的图像,减少了由于图像方向错乱给批量图像的文字识别带来的麻烦。附图说明图1为本专利技术图像自动定向装置的总体框图。图2为本专利技术实施例中挑选待识别文字的效果图。图3为本专利技术用试识别方法判定图像方向的流程图。图4为本专利技术顺时针旋转90度的图像效果图。图5为本专利技术顺时针旋转180度的图像效果图。图6为本专利技术自动旋转后的效果图。具体实施例方式下面结合附图及具体实施方式对本专利技术作进一步的描述。如图1所示,一种图像的自动定向装置,包括图像输入装置、文字获取装置、归一化装置、识别定向装置和旋转输出装置。一种图像自动定向的装置,包括图像输入装置,用于将输入的文档转换为数字图像;文字获取装置,用于挑选数字图像有代表性文字块;归一化装置,包括用于将挑选出的文字块归一化为点阵的归一化模块,用于将点阵按照从识别定向装置获得的方向信息进行旋转的旋转器模块;识别定向装置,包括用于将点阵进行试识别的识别器模块,用于根据识别结果修改权值的距离统计模块,用于设定方向的初始权值,按权值大小排列方向序列,将权值第一位的方向信息传递给归一化装置,计算方向序列排在第一位的方向上识别过的点阵个数,判断图像正确方向的方向判定模块;输出装置,用于根据判断出的方向旋转图像,并将图像输出。作为本专利技术的进一步改进,所述的文字获取装置包括用于获得大部分文字块的获取文字块模块;用于提取最有代表性文字块的筛选文字模块。作为本专利技术的进一步改进,所述的获取文字块模块是通过版面分析、切分技术实现或通过求取连通域的形式实现。作为本专利技术的进一步改进,所述的识别器模块通过模板点匹配法实现。一种图像的自动定向方法,包括以下步骤将输入文档转换为数字图像数据,所述的文档可以是打印文档、手写文档或其他形式的文档。挑选出数字图像中有代表性的文字块。本专利技术所述的挑选文字块的过程中,首先要获得图像上的大部分文字块,然后再在这些文字中挑选符合条件的,送入归一化及识别定向装置。如图2是本专利技术实施例中挑选的待识别文字块图。获得决大本文档来自技高网...

【技术保护点】
一种图像自动定向的方法,其特征在于,包括以下步骤:(一)将输入文档转换为数字图像,对数字图像的每一方向上设定相同的初始权值,默认其中任意一个方向的权值排在方向序列的第一位;(二)挑选出数字图像中的部分文字块;(三)取 方向序列中权值排在第一位的方向,将步骤(二)中得到的文字块归一化成点阵后旋转为此方向,进行试识别,根据试识别结果调整方向权值;(四)将方向序列按权值从大至小重新排列,若权值相等,则按照试识别的时间次序将较远或是没有参加试识别的方向排 在前面,统计方向序列中排在第一位的方向的参数值,所述的参数值包括此该方向上进行过试识别的总的点阵个数、识别结果好的点阵个数和识别结果差的点阵个数;(五)根据步骤(四)得到的参数,进行以下操作:系统设定的需要试识别最少点阵个数 为Wmin,系统设定的需要试识别最多点阵个数为Wmax,1)如果W<Wmin,则返回步骤(三);2)如果Wmin≤W<Wmax,则判断是否满足公式Wg>Wb*α,其中,所述的α为常数系数;判断结果为是,则判定 排在第一位的方向为正确方向,进入步骤(六);判断结果为否,则返回步骤(三);3)如果W≥Wmax,则判断是否满足公式Wg>Wb和W>Wb*β,其中,所述的β为常数系数;判断结果为是,则判定排在第一位的方向为正确方向, 进入步骤(六);判断结果为否,则判定图像的原方向为正确方向,进入步骤(六);其中,所述的W为进行过试识别的总的点阵个数,所述的Wg为识别结果好的点阵个数,所述的Wb为识别结果差的点阵个数;(六)根据步骤(五)得到的方 向,将图像旋转并输出。...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘芝康凯李鹏
申请(专利权)人:北大方正集团有限公司北京北大方正技术研究院有限公司北京大学
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1