本发明专利技术公开了对象检测方法及设备。更特别地,提供了一种检测图像中的多个对象区域的方法,所述多个对象区域具有相似的特定结构特征,该方法包括:估计步骤,用于估计所述多个对象区域的特定结构特征的公共初始值;以及确定步骤,用于基于所估计的公共初始值,确定所述多个对象区域中的每一个的特定结构特征的最终值及该特定结构特征的最终位置。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了对象检测方法及设备。更特别地,提供了一种检测图像中的多个对象区域的方法,所述多个对象区域具有相似的特定结构特征,该方法包括:估计步骤,用于估计所述多个对象区域的特定结构特征的公共初始值;以及确定步骤,用于基于所估计的公共初始值,确定所述多个对象区域中的每一个的特定结构特征的最终值及该特定结构特征的最终位置。【专利说明】对象检测方法及设备
本专利技术涉及用于图像中的对象的检测的方法和设备。更具体而言,本专利技术涉及用于检测图像中的具有相似的特定结构特征的多个对象区域的方法和设备。
技术介绍
近年来,对象检测广泛应用于图像处理、计算机视觉以及模式识别,并且在其中起到了重要作用。常见的一种对象检测是检测图像中的具有相似甚至相同特征的对象(例如人的瞳孔等),并且存在多种用于这样的对象检测的技术。下文将以人脸图像中的瞳孔检测为例来说明当前的现有技术中的用于检测图像中的具有相似甚至相同特征的多个对象的技术。对于瞳孔检测,由于瞳孔中心与虹膜中心相近并且眼睛虹膜的形状大致为圆形,因此实际上,虹膜边界被检测并且被用于估计瞳孔中心。已知的最好的并且被最透彻研究的算法或许是基于 J.Daugman, “High Confidence Visual Recognition of Persons bya Test of Statistical Independence”,PAMI, 1993 (下文被称为 Daugman)中所描述的工作的算法,该算法使用积分微分算子来找到虹膜的圆形边界。另一种公知的算法是基于R.Wildes, “Iris Recognition:An Emerging Biometric Technology,,,Proc.1EEE, 1997所采用的圆形霍夫(Hough)变换。但是,这些通常的方法主要是尽力精确地定位单个眼睛图像中的瞳孔中心,也就是说,独立地确定各眼睛中的瞳孔中心,而没有关注人脸图像中的左眼与右眼之间的关系。因此,通常的方法所得到的结果显示两个瞳孔的半径尺寸之间的差异非常大,如图13A所/Jn ο此外,这些通常的方法中的另一缺陷是当照片环境的不确定性(例如不均匀的光)以及周围对象的局部环状黑暗区域(例如,眼眉、眼镜、头发等)在图像中显现时,这些通常的方法的检测结果变得不可靠。美国专利N0.7197166公开了一种虹膜提取方法,该方法能够精确地确定数字人脸图像中的虹膜的位置和大小。该方法使用人脸图像中的左眼与右眼之间的关系来定位虹膜,并且如示出了该方法的关键流程图的图2所示,该方法包括以下步骤:粗略检测人脸图像中的两个眼睛的位置,并且测量这两个位置之间的距离;根据该距离定义两个矩形搜索区域(这两个矩形的尺度(scale)与该距离有关);以及对于每个矩形搜索区域独立地精确定位虹膜。尽管该方法采用两个眼睛的位置之间的距离来确定虹膜或瞳孔的矩形搜索区域,但是该方法没有考虑这两个虹膜的相似特征(例如,相同的半径)。这可能导致最终虹膜位置不准确。如上所述,仍需要一种能够准确检测图像中的具有相似特征的多个对象区域的方法。
技术实现思路
本专利技术正是针对图像中的具有相似特征的多个对象区域的检测而被开发出的,并且旨在解决如上所述的问题。根据本专利技术的一个方面,提供了一种检测图像中的多个对象区域的方法,所述多个对象区域具有相似的特定结构特征,该方法包括:估计步骤,用于估计所述多个对象区域的特定结构特征的公共初始值;以及确定步骤,用于基于所估计的公共初始值,确定所述多个对象区域中的每一个的特定结构特征的最终值及该特定结构特征的最终位置。根据本专利技术的另一个方面,提供了一种检测图像中的多个对象区域的设备,所述多个对象区域具有相似的特定结构特征,该设备包括:估计单元,被配置为估计所述多个对象区域的特定结构特征的公共初始值;以及确定单元,被配置为基于所估计的公共初始值,确定所述多个对象区域中的每一个的特定结构特征的最终值及该特定结构特征的最终位置。根据本专利技术的另一方面,提供了一种用于检测人脸图像中的两个眼睛瞳孔区域的方法,所述两个眼睛瞳孔区域具有相似的半径,所述方法包括:估计步骤,用于估计所述两个眼睛瞳孔区域的半径的公共初始值;以及确定步骤,用于基于所估计的公共初始值,对于所述两个眼睛瞳孔区域中的每一个单独地确定该眼睛瞳孔区域的半径的最终值以及该眼睛瞳孔区域的最终中心。根据本专利技术的另一方面,提供了一种用于检测人脸图像中的两个眼睛瞳孔区域的设备,所述两个眼睛瞳孔区域具有相似的半径,所述设备包括:估计单元,被配置为估计所述两个眼睛瞳孔区域的半径的公共初始值;以及确定单元,被配置为基于所估计的公共初始值,对于所述两个眼睛瞳孔区域中的每一个单独地确定该眼睛瞳孔区域的半径的最终值以及该眼睛瞳孔区域的最终中心。本专利技术中所提出的解决方案采用一种对象类别的多个区域(即多个对象区域)之中的相似特定结构特征来精确确定该多个区域的位置。更具体而言,本专利技术中所提出的解决方案通过考虑该对象类别的多个区域之间的相似性并且单独考虑该对象类别的多个区域中的每一个在图像中的实际位置检测该对象类别的多个区域,由此可简单地解决上述通常的方法的问题,并且实现精确的对象检测以便精确确定图像中的该对象类别的多个区域中的每一个的位置和特定结构特征。从参照附图的示例性实施例的以下描述,本专利技术的其它特征将变得清晰。【专利附图】【附图说明】并入说明书中并且构成说明书的一部分的附图示出了本专利技术的实施例,并且与描述一起用于解释本专利技术的原理。在附图中,相似的附图标记指示相似的项目。图1是示出可实现本专利技术的实施例的计算机系统的示例性硬件配置的框图。图2是说明示出现有技术所公开的方法的图示。图3A是示出根据本专利技术的基本实施例的方法的流程图,图3B是示出估计步骤中的处理的流程图,并且图3C是示出确定步骤中的处理流程图。图4是示出根据本专利技术的基本实施例的设备的框图。图5A至示出示例I中的检测方法的过程,其中图5A是输入图像中的两个眼睛瞳孔区域的示意图,图5B示意性地示出相对于两个眼睛瞳孔区域的估计过程,图5C示意性地示出相对于两个眼睛瞳孔区域的确定过程,并且图示意性地示出示例I的检测结果。图6示意性地示出两个眼睛瞳孔区域之间的距离。图7示意性地示出用于两个眼睛瞳孔区域的置信值计算的倾斜校正。图8A和8B示意性地示出反光点(specular reflection)校正。图9示意性地示出对于对象区域的局部区域预处理。图10是示出根据本专利技术的眼睛瞳孔区域检测的优选实现的流程图。图11是示出根据本专利技术的眼睛瞳孔区域检测设备的框图。图12示出图像中的眼睛瞳孔区域的一些检测结果。图13A和13B示出通过现有技术的常用方法以及根据本专利技术的方法所获得的检测结果之间的比较。图14示出拳头图像中的手指的宽度。图15示意性地示出相邻手指之间的缝隙的剩余的梯度信息。图16A和16B示出平行线到霍夫空间的映射。图17示出用于霍夫变换中的参数P Θ的累加单元的划分。图18示意性地示出所计算的两个拳头中的手指的宽度的公共初始值以及相应的位置。图19示意性地示出两个拳头中的手指的最终宽度以及相应的最终位置。图20是示出根据本专利技术的拳头检测的优选实现的流程图。图21示出通过本专利技术的拳头本文档来自技高网...
【技术保护点】
【技术特征摘要】
【专利技术属性】
技术研发人员:陈曾,胥立丰,朱福国,
申请(专利权)人:佳能株式会社,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。