图像分割和增强制造技术

技术编号:4567649 阅读:250 留言:0更新日期:2012-04-11 18:40
描述了用于分割和增强图像的方法、装置及机器可读介质。在一个方面中,给定图像(16)的相应像素处的梯度幅度值被确定。使用全局阈限对该梯度幅度值进行阈值化处理以产生阈值化的梯度幅度值(20)。根据阈值化的幅度值(20)的分水岭变换,将所述像素分割成相应组。产生分类记录(18)。该分类记录(18)将那些被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将那些被分割到除了所述最大组之外的任何组中的像素标记为非背景像素。

【技术实现步骤摘要】
【国外来华专利技术】专利说明图像分割和增强
技术介绍
图像分割一般包括将图像的目标区域与该图像的背景区域分开。用于分割图像的许多不同方法已经被提出,包括基于阈值化、区域生长以及分水岭变换(watershed transform)的图像分割处理。这种处理的分割结果可被用于多种不同应用,包括用于目标描述或识别的目标提取。一般地,噪声降低了图像分割处理能够从背景区域中分割目标的精度。 由配备照相机的手持设备(例如,数码相机、蜂窝电话以及个人数字助理)所捕获的数字图像中的类文本(text-like)目标经常被不均匀的照明和模糊劣化。这些人工因素的存在显著降低了再现的数字图像的整体外观质量。此外,这种劣化不利地影响OCR(光学字符识别)精度。 所需要的是能够以对文本字体大小、模糊水平以及噪声稳健的方式分割和增强文档图像(document image)的装置和方法。
技术实现思路
在一个方面中,本专利技术的特征在于一种方法,根据该方法,确定给定图像的相应像素处的梯度幅度值。使用全局阈限对该梯度幅度值进行阈值化处理以生成阈值化的(thresholded)梯度幅度值。根据阈值化的幅度值的分水岭变换,将所述像素分割成相应的组。产生分类记录。该分类记录将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了最大组之外的任何组中的像素标记为非背景像素。 本专利技术的特征还在于一种装置以及存储有使机器实现上述方法的机器可读指令的机器可读介质。 根据包括附图和权利要求书的以下描述本专利技术的其它特征和优点将变得显而易见。 附图说明 图1是图像处理系统的实施例的框图。 图2是被不均匀照明的文本的图像的示例。 图3是图像处理方法的实施例的流程图。 图4是由根据附图3中的方法的实施例从图2的图像中导出的梯度幅度值所组成的图像的示例。 图5A是在说明性图像的相应像素处的所设计的(devised)梯度幅度值的阵列的图示。 图5B是根据基于分水岭变换的图像分割处理而分配给图5A中所示图像的像素的标签的阵列的图示。 图6A是包含文本的图像的示例。 图6B是示出不同标签的灰度级图像,其中根据图3中所示方法的分割处理的实施例,将所述标签分配给图6A中图像的像素。 图6C是根据图3中所示方法中的分类记录产生处理的实施例,从图6B的灰度级图像中产生的形式为二进制分割图(map)的分类记录的示例。 图7是以二进制分割图为形式的分类记录的示例,其中黑色像素代表在图2的图像中检测到的目标像素并且白色像素代表在图2的图像中检测到的背景像素。 图8是图1中所示的图像处理系统的实施例的框图。 图9是由根据本专利技术的实施例为图2中图像的像素所估计的照明值(illuminant value)所组成的图像的示例。 图10是根据本专利技术实施例的基于图9中所示的照明值从图2的图像中导出的照明校正图像的示例。 图11是根据本专利技术的实施例从图10中的图像导出的锐化图像的示例。 图12是合并了图1中的图像处理系统的实施例的装置的实施例的框图。 图13是合并了图1中的图像处理系统的实施例的装置的实施例的框图。 具体实施例方式 在接下来的描述中,相同的附图标记被用于标识相同的元件。进一步,附图打算以图解的方式示出示例性实施例的主要特征。附图并不打算描绘实际实施例的每一个特征,也不打算描绘所示出元件的相对尺寸,并且不是按比例绘制。 I.引言 以下详细描述的实施例能够以对模糊水平(blur level)和噪声稳健(robust)的方式来分割和增强图像。这些实施例以特别对于包含文本的图像达到改进的抗噪结果的方式在基于分水岭变换的图像分割之前合并了全局阈值化处理(thresholding)。在执行基于分水岭变换的图像分割之前,该全局阈值化处理消除或破坏图像中的噪声结构。一些实施例通过各种各样的方式使用分割结果来增强文档图像,所述方式包括校正不均匀照明、使对象目标区域(target objectregion)变暗以及锐化对象目标区域。这些实施例的实施对于以对文本字体大小、模糊水平以及噪声稳健的方式增强文本非常有用。 II.概述 图1示出了包括预处理模块12和分割模块14的图像处理系统10的实施例。该图像处理系统根据图像16生成分类记录18,该分类记录18将图像16的像素标记为背景像素或者非背景像素。在这一处理中,预处理模块12处理图像16以生成中间图像20,该中间图像20具有提高分割模块14能够将图像16中的对象目标区域与图像16中的背景区域区分开的准确性的特性。 图像16可以对应于任何类型的数字图像,包括由图像传感器(例如,数字摄像机、数字静止图像照相机或者光学扫描仪)所捕获的原始图像(例如,视频关键帧、静止图像或扫描图像)或这种原始图像的处理过的(例如,子抽样的、过滤的、重新格式化的、增强的或者以其它方式修改的)版本。图2示出了包括被不均匀照明的文本的图像16的示例22。在以下详细描述中,示例性图像22和从其获得的各种图像数据仅为了说明性目的而被用于解释本专利技术的一个或多个实施例的一个或多个方面。 一般地,分类记录18可以被用于各种不同目的,包括图像增强、目标检测、目标追踪、目标描述以及目标识别。以下详细描述的本专利技术的一些实施例使用分类记录18来对图像16执行以下图像增强操作中的一个或多个减少不均匀照明的影响;使类文本目标变暗和锐化。 III.将图像分割成背景区域和对象目标区域 A.概述 图3示出了由图像处理系统10所实施的方法的实施例。根据这一方法,预处理模块12确定图像16的相应像素处的梯度幅度值(图3,块24)。预处理模块12使用全局阈限对梯度幅度值进行阈值化处理以生成阈值化的梯度幅度值(图3,块26)。分割模块14根据阈值化的梯度幅度值的分水岭变换,将图像16的像素分割成若干组(图3,块28)。分割模块14产生分类记录18。分类记录18将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了最大组之外的任何组中的像素标记为非背景像素(图3,块30)。 B.确定梯度幅度值 如上所述,预处理模块12确定图像16的相应像素处的梯度幅度值(图3,块24)。在一些实施例中,预处理模块12在确定梯度幅度值之前对图像16的像素值降噪。为了这一目的可以使用任何类型的降噪滤波器,包括高斯平滑滤波器以及双边平滑滤波器。在其它实施例中,预处理模块12直接从图像16的像素值确定梯度幅度值。 一般地,预处理模块12可以使用任何类型的梯度滤波器或者算子来确定梯度幅度值。如果图像16是灰度级图像,那么预处理模块12可以使用例如基本微分滤波器(basic derivative filter)、普鲁伊特(Prewitt)梯度滤波器、索贝尔(Sobel)梯度滤波器、高斯(Gaussian)梯度滤波器或者另一类型的形态学梯度滤波器来确定梯度幅度值。如果图像16为彩色图像,那么预处理模块12可以将图像16转变成灰度级图像,并且将上述所列类型的梯度滤波器应用到灰度值以确定梯度幅度。可选地,预处理模块12可以将彩色图像转变成YCrCb彩色图像,并且将上述所列类型的梯度滤波器应用到亮度(Y)值以确定梯度幅度。在一本文档来自技高网...

【技术保护点】
一种方法,包括: 确定给定图像(16)的相应像素处的梯度幅度值; 使用全局阈限对所述梯度幅度值进行阈值化处理以产生阈值化的梯度幅度值(20); 根据所述阈值化的幅度值(20)的分水岭变换将所述像素分割成相应组;以及  产生分类记录(18),该分类记录将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了所述最大组之外的任何组中的像素标记为非背景像素。

【技术特征摘要】
【国外来华专利技术】US 2007-4-27 11/741,1881、一种方法,包括确定给定图像(16)的相应像素处的梯度幅度值;使用全局阈限对所述梯度幅度值进行阈值化处理以产生阈值化的梯度幅度值(20);根据所述阈值化的幅度值(20)的分水岭变换将所述像素分割成相应组;以及产生分类记录(18),该分类记录将所述像素中被分割到这些组中被确定为在大小上是最大的一个组中的像素标记为背景像素,并将所述像素中被分割到除了所述最大组之外的任何组中的像素标记为非背景像素。2、根据权利要求1所述的方法,进一步包括在所述确定之前,从降噪的上游图像中导出所述给定图像(16)。3、根据权利要求1所述的方法,进一步包括根据所述给定图像(16)的像素值和分类记录(18)生成增强图像(48),其中所述生成包括根据被标记为背景像素的所述给定图像的那些像素的值估计所述给定图像(16)的像素的相应照明值,其中所述给定图像(16)的像素包括那些被标记为非背景像素的像素。4、根据权利要求5所述的方法,其中所述生成包括根据给定图像(16)的空间上对应的那些像素值与根据所估计的照明值确定的相应色调值的比值,来计算增强图像(48)的像素值。5、根据权利要求6所述的方法,其中所述计算包括响应于确定对应的估计的照明值低于照明阈限值,将所述增强图像(48)的像素值设置为比给定图像(16)的空间上对应的那些像素值更暗,以及响应于确定对应的估计...

【专利技术属性】
技术研发人员:J范
申请(专利权)人:惠普开发有限公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1