当前位置: 首页 > 专利查询>诺基亚公司专利>正文

用于在数字图像中检测目标的方法、设备及计算机程序产品技术

技术编号:7868309 阅读:286 留言:0更新日期:2012-10-15 02:31
提供了用于在数字图像中检测目标的方法、设备和计算机程序产品。所述方法包括提供检测窗口和通过以第一步长遍历所述检测窗口到一组像素上在数字图像中确定所述目标的至少一个区域。进一步,在每个像素上,检测在所述检测窗口中所述目标的至少一部分的存在。根据目标的存在的检测,所述检测窗口以第二步长移动到邻近像素。进一步,如果在所述邻近像素上,所述目标的至少一部分存在于至少阈值数的检测窗口中,则选择所述检测窗口作为所述目标的一个区域。之后,基于所述至少一个区域选择在数字图像中代表目标的目标区域。

【技术实现步骤摘要】
【国外来华专利技术】
本公开一般涉及数字图像处理,并且更特别涉及用于在数字图像中检测目标的方法、设备及计算机程序产品
技术介绍
在数字图像处理的许多应用中,广泛使用目标检测。目标的例子可包括但不局限于,人的脸部,任何货物或车辆,或为安全目的被仔细检查的任何商品。目标检测例如脸部检测,可定义为定位在数字图像中脸部的存在。在数字图像中的脸部检测可用于例如脸部识别,脸部追踪,照片标记,图像检索,安全监视和例如脸部优先、自动聚焦和自动平衡等改进在照相机中的照片质量的应用中。在多数数字图像处理应用中,目标检测由评估分类器(evaluating classifier)进入数字图像的不同部分执行。分类器对应于将在数字图像中检测的目标性质。分类器一般使用基于历史数据和学习算法从相似的数字图像中提取的特征创建。分类器在Viola.P 等人在 2004 年发表在 International Journal of Computer Vision 第 57 卷第 2 期第137-154页的标题为“Robust Real-Time Face Detection”的论文中详细描述。分类器应用到数字图像内的子窗口(sub window)以用于检测目标的存在。进一步,为了在数字图像中的目标检测,该子窗口穿过数字图像逐步移动直到覆盖整个数字图像。典型的数字图像示意性地表示在图I中。数字图像在X (宽)和Y (高)方向延伸。如图I所示,数字图像在整个宽度具有W像素且在整个深度具有H像素。多数目标检测技术使用经由分类器扫描整个数字图像。在一个这样的技术中,为子窗口计算强分类器(strongclassifier)。子窗口可包括像素阵列,例如MxN像素,在其中M和N是整数。在一个技术中,子窗口以I个像素的步长穿过数字图像扫描。以I个像素的步长的数字图像的扫描表示子窗口在数字图像的每个像素上遍历(traverse)而不会跳过任何像素。进一步为在数字图像的每个像素的子窗口计算分类器的值。根据在给定像素的分类器的值,在给定像素上的检测窗口内检测出目标的存在。在这样的技术中,目标检测率很高,因为目标的存在是在数字图像的每个像素上检查的。在此,目标检测率指的是在数字图像中准确的目标检测百分比。进一步,在该技术中,目标检测时间正比于高度和宽度的乘积,例如在数字图像中像素的总个数,因为子窗口在数字图像的每个像素上扫描。在另一个已知的技术中,数字图像由子窗口以超过I个像素(例如2个像素)的步长扫描。在该技术中,子窗口通过在数字图像中跳过I个像素遍历。相应地,在以2个像素步长扫描数字图像中所花费的时间比在以I个像素的步长扫描数字图像中所花费的时间小。然而,相对于I个像素的步长的目标检测率,当以2个像素的步长扫描时目标检测率变差。在一个表示中,以I个像素的步长扫描数字图像所花费的时间可正比于W * H,然而以2个像素的步长扫描数字图像所花费的时间可正比于W/2 * H/2。进一步,以I个像素的步长目标检测率可为“R%”,而以2个像素的步长的可近似为(R-10) %。在这些现有技术中,在目标检测率和扫描数字图像所花费的时间(处理时间)之间存在一个权衡(tradeoff)0例如,如果目标检测率增加,则处理时间也增加。鉴于上述讨论,存在在数字图像中有效检测目标的需求
技术实现思路
各种实施例的一般目的是为了描述用于在数字图像中检测目标的方法、设备及计算机程序产品。一方面,提供了在具有多个像素的数字图像中用于检测目标的方法。所述方法包括提供该多个像素的MxN像素的检测窗口。进一步,所述方法包括通过以第一步长遍历检测窗口到在数字图像的一组像素上,确定在数字图像中的目标的至少一个区域。在这组像素的每个像素上,检测在检测窗口中的目标的至少一部分的存在。根据在该检测窗口中的目标的至少一部分存在的检测,该检测窗口以第二步长在邻近区域中移动。此外,所述方法包括在邻近像素上的每个检测窗口中检测目标的至少一部分的存在。而且,所述方法包括如果在邻近像素上至少阈值数的检测窗口存在目标的至少一部分,则选择所述检测窗口作为在数字图像中的目标的一个区域。其后,基于目标的至少一个区域,选择在数字图像中代表目标的目标区域。在一个实施例中,所述方法通过计算检测窗口的MxN像素的分类器值,检测在检测窗口中目标的至少一部分的存在。进一步,该分类器值与第一阈值数进行比较。如果该分类器值大于该第一阈值数,则检测到目标的至少一部分在该检测窗口中存在。在另一实施例中,通过确定至少一部分存在的可能性,在检测窗口中检测目标的至少一部分的存在。该存在的可能性通过计算检测窗口的MxN像素的分类器值来确定。进一步,该分类器值与第二阈值数进行比较。如果该分类器值大于该第二阈值数,则目标的至少一部分很可能存在于检测窗口中。在一个实施例中,第二步长小于第一步长。例如,第一步长可为2个像素,而第二步长可为I个像素。进一步,在一个实施例中,基于由目标的至少一个区域所覆盖的整个区域选择目标区域。在另一实施例中,基于目标的至少一个区域中共同的区域选择目标区域。在另一方面,提供了一种设备。所述设备包括至少一个处理器和至少一个存储器。所述至少一个存储器包括计算机程序代码,该至少一个存储器和计算机程序代码配置成,通过该至少一个处理器,使得设备至少执行定义MxN像素的检测窗口和从一个第一像素到第二像素穿过数字图像遍历检测窗口 ;通过以第一步长遍历检测窗口到一组像素确定在数字图像中的目标的至少一个区域;在该组像素的每个像素上检测在检测窗口中目标的至少一部分的存在;根据在该检测窗口中目标的至少一部分存在的检测,以第二步长在邻近区域移动该检测窗口 ;在邻近像素上的检测窗口中检测目标的至少一部分的存在;和如果在邻近像素上至少阈值数的检测窗口中存在目标的至少一部分,则选择检测窗口作为在数字图像中的目标的一个区域;和基于目标的至少一个区域,选择在数字图像中代表目标的目标区域。在一个实施例中,该至少一个存储器和计算机程序代码配置成,通过该至少一个处理器,使得该设备至少在像素上计算检测窗口的MxN像素的分类器值和比较该分类器值和第一阈值数以检测在检测窗口中至少一部分的存在,其中如果该分类器值大于该第一阈值,则该至少一部分存在于该检测窗口中。在另一个实施例中,该至少一个存储器和计算机程序代码配置成,通过该至少一个处理器,使得该设备至少基于检测窗口的MxN像素的分类器值和该分类器值和第二阈值数的比较,检测在检测窗口中目标的至少一部分的存在。如果该分类器值大于该第二阈值数,则目标的至少一部分很可能存在于检测窗口中。在一个实施例中,该至少一个存储器和计算机程序代码配置成,通过该至少一个处理器,使得该设备至少存储至少一个分类器、第一阈值数和第二阈值数。进一步,在一个实施例中,第二步长可小于第一步长。例如,第一步长可为2个像素,而第二步长可为I个像素。此外,在一个实施例中,处理器配置成合并该至少一个区域以选择目标区域。在另一个实施例中,该至少一个存储器和计算机程序代码配置成,通过该至少一个处理器,使得该设备至少基于在目标的至少一个区域中共同的区域选择目标区域。在另一方面,提供了用于在具有多个像素的数字图像中检测目标的计算机程序产品。所述计算机程序产品包括至少一个计算机可读存储介本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2009.12.30 IN 3225/CHE/20091.ー种方法,包括 在数字图像中提供多个像素的MxN像素的检测窗ロ,其中M和N是自然数; 在所述数字图像中通过以第一步长遍历所述检测窗ロ到一组像素上且通过执行以下步骤确定目标的至少ー个区域 确定所述目标的至少一部分是否存在于所述检测窗口中; 根据在所述检测窗口中的所述目标的至少一部分存在的检测,在邻近区域中以第二步长移动所述检测窗ロ; 确定所述目标的所述至少一部分是否存在于在邻近像素上的检测窗ロ中;以及如果所述目标的所述至少一部分存在于在所述邻近像素上的至少阈值数的检测窗ロ中,则选择所述检测窗ロ作为所述数字图像中的所述目标的ー个区域;以及 基于所述目标的所述至少ー个区域选择在所述数字图像中代表所述目标的目标区域。2.如权利要求I的方法,其中在所述检测窗口中检测所述目标的所述至少一部分的存在包括 计算所述检测窗ロ的所述MxN像素的分类器值;以及 比较所述分类器值和第一阈值数,其中如果所述分类器值大于所述第一阈值数则所述目标的所述至少一部分存在于所述检测窗ロ中。3.如权利要求I的方法,其中在所述检测窗口中检测所述目标的所述至少一部分的存在包括通过以下步骤确定所述目标的所述至少一部分的存在的可能性 计算所述检测窗ロ的所述MxN像素的分类器值;以及 比较所述分类器值和第二阈值数,其中如果所述分类器值大于所述第二阈值数则所述目标的所述至少一部分很可能存在于所述检测窗口中。4.如权利要求I的方法,其中所述第二步长小于所述第一步长。5.如权利要求I的方法,其中所述第一步长是2个像素且所述第二步长是I个像素。6.如权利要求I的方法,其中基于所述目标的所述所述至少ー个区域所覆盖的全部区域选择所述目标区域。7.如权利要求I的方法,其中基于在所述目标的所述至少ー个区域和所述目标的至少另ー个区域共同的区域选择所述目标区域。8.—种设备,包括 至少ー个处理器;和 至少ー个包括计算机程序代码的存储器,所述至少一个存储器和所述计算机程序代码配置成,通过所述至少ー个处理器,使得所述设备至少执行 在数字图像中定义多个像素的MxN像素的检测窗ロ,其中M和N是自然数; 在所述数字图像中通过以第一步长遍历所述检测窗ロ到一组像素上且通过执行如下步骤确定目标的至少ー个区域 确定所述目标的至少一部分是否存在于所述检测窗口中; 根据在所述检测窗口中所述目标的所述至少一部分存在的检测,以第二步长在邻近区域中移动所述检测窗ロ; 确定所述目标的所述至少一部分是否存在于在邻近像素上的所述检测窗ロ中;以及 如果在所述邻近像素上所述目标的所述至少一部分存在于至少阈值数的所述检测窗ロ中,则选择所述检测窗ロ作为所述数字图像中的所述目标的ー个区域;以及 基于所述目标的所述至少ー个区域选择在所述数字图像中代表所述目标的目标区域。9.如权利要求8的设备,其中所述至少一个存储器和所述计算机程序代码配置成,通过所述至少ー个处理器,使得所述设备至少进ー步执行 在像素上计算所述检测窗ロ的所述MxN像素的分类器值; 比较所述分类器值和第一阈值数以检测在所述检测窗口中所述至少一部分的存在,其中如果所述分类器值大于所述第一阈值数则所述至少一部分存在于所述检测窗口中。10.如权利要求9的设备,其中所述至少一个存储器和所述计算机程序代码配置成,通过所述至少ー个处理器,使得所述设备至少进ー步执行 检测在所述检测窗ロ中所述目标的所述至少一部分的存在,基于 所述检测窗ロ的所述MxN像素的分类器值;以及 所述分类器值和第二阈值数的比较,其中如果所述分类器值大于所述第二阈值数则所述目标的所述至少一部分很可能存在于所述检测窗ロ中。11.如权利要求10的设备,其中所述至少一个存储器和所述计算机程序代码配置成,通过所述至少ー个处理器,使得所述设备至少进ー步执行 存储至少ー个分类器、所述第一阈值数和所述第二阈值数。12.如权利要求8的设备,其中所述第二步长小于所述第一步长。13.如权利要求8的设备,其中所述第一步长是2个像素且所述第二步长是I个像素。14.如权利要求8的设备,其中所述至少一个存储器和所述计算机...

【专利技术属性】
技术研发人员:P·米施拉V·穆尼恩德尔K·A·戈文达拉奥R·诺普苏万查伊
申请(专利权)人:诺基亚公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1