图像处理装置和方法制造方法及图纸

技术编号:8241631 阅读:189 留言:0更新日期:2013-01-24 22:34
图像处理装置和方法。图像处理装置包括:局部均值图生成部分,其生成局部均值图;二值化图生成部分,其生成二值化图,其中与高频区域对应的像素具有第一灰度,与低频区域对应的像素具有第二灰度;三值化图生成部分,其根据图像与局部均值图的比较,将二值化图中第一灰度区域划分为第一灰度区域和第三灰度区域以生成三值化图;填充部分,其识别三值化图中第二灰度连通区域,并在连通区域边界处第一灰度像素与第三灰度像素数量比大于预定阈值时以第一灰度填充连通区域,而在连通区域边界处第三灰度像素与第一灰度像素数量比大于预定阈值时以第三灰度填充该连通区域;以及识别部分,其根据对象边界灰度一致性识别图像中的笔画和/或线条。

【技术实现步骤摘要】

本专利技术涉及,具体涉及用于识别图像中的笔画和线条的。
技术介绍
把文字和图片从文档图像中分离出来是一种很有用的技术,可用于文档布局分析、文档图像分层压缩等。已有的商业化的产品包含一种文档图像压缩技术,例如在彩色模式300DPI采样的条件下,它能够把一典型的杂志页压缩到40 60KB,这种压缩率大约是JPEG压缩率的5-10倍,而且保持了主观上相近的图像质量。典型的现有图像压缩技术的首要阶段是通过二维的隐马尔可夫模型把前景(文字)和背景(图片和文档背景)分开。它在前景分离的初始阶段,往往导致过分割,于是应用一些不同的滤波器删除大多数的明显错误。·
技术实现思路
根据本专利技术的一个实施例,提供一种图像处理装置,包括局部均值图生成部分,被配置为生成所要处理的图像的局部均值图;二值化图生成部分,被配置为生成该图像的二值化图,在二值化图中,与该图像中的高频区域相对应的像素具有第一灰度,而与该图像中的低频区域相对应的像素具有第二灰度;三值化图生成部分,被配置为根据该图像与局部均值图的比较,将二值化图中具有第一灰度的区域划分为具有第一灰度的区域和具有第三灰度的区域,从而生成三值化图;填充部分,被配置为识别三值化图中具有第二灰度的连通区域,并且在连通区域的边界处具有第一灰度的像素与具有第三灰度的像素的数量比大于预定阈值时,以第一灰度填充该连通区域,而在连通区域的边界处具有第三灰度的像素与具有第一灰度的像素的数量比大于该预定阈值时,以第三灰度填充该连通区域;以及识别部分,被配置为根据经填充的三值化图中对象边界处的灰度一致性来识别图像中的笔画和/或线条。根据本专利技术的另一个实施例,提供一种图像处理方法,包括步骤生成所要处理的图像的局部均值图;生成该图像的二值化图,在二值化图中,与该图像中的高频区域相对应的像素具有第一灰度,而与该图像中的低频区域相对应的像素具有第二灰度;根据该图像与局部均值图的比较,将二值化图中具有第一灰度的区域划分为具有第一灰度的区域和具有第三灰度的区域,从而生成三值化图;识别三值化图中具有第二灰度的连通区域,并且在连通区域的边界处具有第一灰度的像素与具有第三灰度的像素的数量比大于预定阈值时,以第一灰度填充该连通区域,而在连通区域的边界处具有第三灰度的像素与具有第一灰度的像素的数量比大于该预定阈值时,以第三灰度填充该连通区域;以及根据经填充的三值化图中对象边界处的灰度一致性来识别该图像中的笔画和/或线条。根据本专利技术的例如具有以下特点既能够识别浅色背景上的深色文字,也能识别深色背景上的浅色文字;能够同时识别各种大小字号的文字,且能够同时识别各种笔画粗细的文字;对文字的识别不受语种的限制;能够识别表格或线条。附图说明 参照以下结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。为了避免因不必要的细节而模糊了本专利技术,在附图中仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术关系不大的其它细节。图I示出根据本专利技术实施例的图像处理装置的配置的示例;图2A示出图像处理对象的示例;图2B示出图2A所示的图像的局部均值图;图2C示出图2A所示的图像的局部方差图;图2D示出根据图2A所示的图像及其局部均值图生成的三值化图;图2E示出经填充的图2D的三值化图;图2F示出从图2E的经填充的三值化图中识别出的对象;图3A示出对浅色背景上的深色文字进行识别的具体示例;图3B示出对深色背景上的浅色文字进行识别的具体示例;图4示出对不包含笔画和线条的图像部分的处理结果的示例;图5是示出根据本专利技术另一实施例的图像处理装置的配置示例的框图;图6A至图6C是示出对四值化图进行定向膨胀的示例;图7A和图7B示出从四值化图像中分离出的文字的示例;图8A和图8B示出根据本专利技术实施例的图像处理装置对包含图形、文字以及线条的图像的处理结果的示例;图9示出根据本专利技术实施例的图像处理方法的流程图;图10示出根据本专利技术另一实施例的图像处理方法的流程图;以及图11是示出其中实现本专利技术的装置和方法的计算机的示例性结构的框图。具体实施例方式下面参照附图说明本专利技术的实施例。应当注意,为了清楚的目的,附图和说明中省略了与本专利技术无关的、本领域普通技术人员已知的部件和处理的表示和描述。图I示出根据本专利技术实施例的图像处理装置的配置的示例。图像处理装置100包括局部均值图生成部分110、二值化图生成部分120、三值化图生成部分130、填充部分140以及识别部分150。作为图像处理装置100的处理对象的图像可以是灰度图像或彩色图像(对于彩色输入图像,可以采用本领域常用的方法将其转换为灰度图像),并且该图像中可以包含图形、文字、线条等内容。当输入图像是被高压缩的图像时,图像处理装置100可以使用低通滤波器(例如,高斯滤波器)对图像进行平滑处理,从而抑制由压缩带来的噪声。例如,图2A示出作为图像处理装置100的处理对象的输入图像的示例,该图像包含左上部的较大文字、左下部的较小文字以及右侧的图形。输入图像被提供给局部均值图生成部分110,局部均值图生成部分110根据输入图像计算局部均值图。具体地,局部均值图生成部分110可以采用局部窗(例如,5像素X 5像素或7像素X7像素的窗)逐像素地计算局部均值以生成局部均值图。在本专利技术的一些实施例中,可以根据处理对象图像中的笔画和/或线条的粗细设置局部均值图生成部分110所使用的局部窗的大小。 例如,图2B示出局部均值图生成部分110根据图2A所示的示例输入图像生成的局部均值图。输入图像也被提供给二值化图生成部分120。二值化图生成部分120根据输入图像生成二值化图,在该二值化图中,位于与输入图像中的高频区域相对应的位置处的像素具有第一灰度,而位于与输入图像中的低频区域相对应的位置处的像素具有第二灰度。例如,该二值化图可以是局部方差图或局部梯度图,并且二值化图生成部分120可以采用局部窗(例如,5像素X5像素或7像素X7像素的窗)逐像素地计算局部方差或梯度以生成二值化图。在本专利技术的一些实施例中,可以根据处理对象图像中的笔画和/或线条的粗细设置二值化图生成部分120所使用的局部窗的大小。根据本专利技术的一个具体实施例,在采用8位灰度图(共256个灰度水平)的情况下,取第一灰度为O (黑),第二灰度为255 (白)。例如,图2C示出二值化图生成部分120根据图2A所示的示例输入图像生成的局部方差图。在该局部方差图中,对应于输入图像中的高频区域(具有高方差的区域)的区域具有灰度0(黑色部分),而对应于输入图像中的低频区域(具有低方差的区域)的区域具有灰度255 (白色部分)。二值化图生成部分120将根据输入图像生成的二值化图提供给三值化图生成部分130。三值化图生成部分130根据输入图像与局部均值图的比较,将从二值化图生成部分120提供的二值化图中具有第一灰度的区域划分为具有第一灰度的区域和具有第三灰度的区域,从而生成三值化图。根据本专利技术的一个实施例,三值化图生成部分130根据以下规则划分二值化图以生成三值化图如果V(i,j) =(mi(i,j)彡 M(i,j),则 T(i,j) = 0;如果V(i,j) =(mi(i,j) > M(i,j),则 T(i,j) = 128 ;如果V(本文档来自技高网...

【技术保护点】
一种图像处理装置,包括:局部均值图生成部分,被配置为生成所要处理的图像的局部均值图;二值化图生成部分,被配置为生成所述图像的二值化图,在所述二值化图中,与所述图像中的高频区域相对应的像素具有第一灰度,而与所述图像中的低频区域相对应的像素具有第二灰度;三值化图生成部分,被配置为根据所述图像与所述局部均值图的比较,将所述二值化图中具有所述第一灰度的区域划分为具有所述第一灰度的区域和具有第三灰度的区域,从而生成三值化图;填充部分,被配置为识别所述三值化图中具有所述第二灰度的连通区域,并且在所述连通区域的边界处具有所述第一灰度的像素与具有所述第三灰度的像素的数量比大于预定阈值时,以所述第一灰度填充所述连通区域,而在所述连通区域的边界处具有所述第三灰度的像素与具有所述第一灰度的像素的数量比大于所述预定阈值时,以所述第三灰度填充所述连通区域;以及识别部分,被配置为根据经填充的所述三值化图中对象边界处的灰度一致性来识别所述图像中的笔画和/或线条。

【技术特征摘要】

【专利技术属性】
技术研发人员:郑大念孙俊直井聪
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1