当前位置: 首页 > 专利查询>索尼公司专利>正文

目标检测设备和方法及分类器训练设备和方法技术

技术编号:7996414 阅读:248 留言:0更新日期:2012-11-22 05:13
本公开提供了目标检测设备和方法及分类器训练设备和方法。目标检测设备可包括:特征提取装置,用于从输入图像中提取一个或更多个特征向量,至少一个所述特征向量包括所述输入图像中的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和,所述至少三个像素位于彼此基本上平行的一组平行线上,该组平行线包括至少两条平行线,并且其中的任意两条相邻平行线之间的距离大于一个像素的尺寸,并且所述至少三个像素中的至少两个像素位于所述一组平行线中的同一平行线上;以及目标判断装置,用于利用分类器、根据所述一个或更多个特征向量来判断所述输入图像中是否存在目标。还提供了包括上述目标检测设备和/或分类器训练设备的电子设备。

【技术实现步骤摘要】

本公开涉及目标检测领域,具体地,涉及图像中的目标检测设备和方法、目标分类器训练设备和方法。
技术介绍
目标检测是图像/视频自动分析中的重要技术之一。在目标检测中,目标特征提取是进行目标检测的基础。由于图像中目标的姿态、背景以及光照条件等的多样性,因此,很难提取统一的颜色或者结构纹理信息作为进行目标检测的有效特征。如何提取用于目标检测的有效特征用于目标分类器训练和目标检测是本领域的重要课题。
技术实现思路
在下文中给出关于本公开的一些方面的简要概述,以便提供对于本公开的基本理解。应当理解,这个概述并不是对本公开的穷举性概述。该概述也并非意图确定本公开的关键或重要部分,也不是意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。根据本公开的一个方面,提供了一种目标检测设备,该目标检测设备可以包括特征提取装置,用于从输入图像中提取一个或更多个特征向量,至少一个所述特征向量包括所述输入图像中的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和,所述至少三个像素位于彼此基本上平行的一组平行线上,该组平行线至少包括两条平行线,并且其中的任意两条相邻平行线之间的距离大于一个像素的尺寸,并且所述至少三个像素中的至少两个像素位于所述一组平行线中的同一平行线上;以及目标判断装置,用于利用分类器、根据所述一个或更多个特征向量来判断所述输入图像中是否存在目标。根据本公开的另一方面,提供了一种目标检测方法,该目标检测方法可以包括从输入图像中提取一个或更多个特征向量,至少一个所述特征向量包括所述输入图像中的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和,所述至少三个像素位于彼此基本上平行的一组平行线上,该组平行线包括至少两条平行线,并且其中的任意两条相邻平行线之间的距离大于一个像素的尺寸,并且所述至少三个像素中的至少两个像素位于所述一组平行线中的同一平行线上;以及利用分类器、根据所述一个或更多个特征向量来判断所述输入图像中是否存在目标。根据本公开的另一方面,提供了包括上述目标检测设备的电子设备。根据本公开的另一方面,提供了一种用于训练目标分类器的设备,该设备可以包括特征提取装置,用于从多个图像样本中的每个中提取一个或更多个特征向量,从每个图像样本中提取的至少一个所述特征向量包括该图像样本中的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和,所述至少三个像素位于彼此基本上平行的一组平行线上,该组平行线包括至少两条平行线,并且其中的任意两条相邻平行线之间的距离大于一个像素的尺寸,并且所述至少三个像素中的至少两个像素位于所述一组平行线中的同一平行线上;以及训练装置,用于利用多个图像样本及所提取的特征向量来训练用于区分待检测目标和背景的分类器。根据本公开的另一方面,提供了一种用于训练目标分类器的方法,该方法可以包括从多个图像样本的每个中提取一个或更多个特征向量,从每个图像样本中提取的至少一个所述特征向量包括该图像样本中的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和,所述至少三个像素位于彼此基本上平行的一组平行线上,该组平行线包括至少两条平行线,并且其中的任意两条相邻平行线之间的距离大于一个像素的尺寸,并且所述至少三个像素中的至少两个像素位于所述一组平行线中的同一平行线上;以及利用所述多个图像样本及所提取的特征向量来训练用于区分待检测目标和背景的分类器。根据本公开的另一方面,提供了包括上述用于训练目标分类器的设备的电子设备。 另外,本公开的实施例还提供了用于实现上述方法的计算机程序。此外,本公开的实施例还提供了至少计算机可读介质形式的计算机程序产品,其上记录有用于实现上述方法的计算机程序代码。附图说明参照下面结合附图对本公开实施例的说明,会更加容易地理解本公开的以上和其它目的、特点和优点。附图中的部件只是为了示出本公开的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。图I是示出根据本公开的一个实施例的用于训练目标分类器的训练方法的示意性流程图;图2是示出根据本公开的一个实施例的用于训练目标分类器的训练设备的结构的示意性框图;图3是示出根据本公开的一个实施例的目标检测方法的示意性流程图;图4是示出根据本公开的一个实施例的目标检测设备的结构的示意性框图;图5是示出根据本公开的一些示例在图像中提取平行线段采样差分特征的示意图;图6是示出根据本公开的一些示例在图像中提取平行线段采样差分特征的示意图;以及图7是示出用于实现本公开的实施例或示例的计算机的结构的示例性框图。具体实施例方式下面参照附图来说明本公开的实施例。在本公开的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。应当注意,为了清楚的目的,附图和说明中省略了与本公开无关的、本领域普通技术人员已知的部件和处理的表示和描述。本公开的一些实施例提供了目标检测设备和方法、目标分类器训练设备和方法以及利用这样的方法或包括这样的设备的电子设备。在本公开中,所谓“图像”可以表示一幅或一组静止图像,也可以表示一个图像序列,如视频图像等。图I是示出了根据本公开的一个实施例的目标分类器训练方法的示意性流程图。如图I所示,目标分类器训练方法可以包括步骤102和104。在步骤102中,从多个图像样本中的每个图像样本中提取一个或更多个特征向量,这里所提取的至少一个特征向量可以包括从该图像样本中选择的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和。所选择的像素要满足以下条件这些像素位于彼此基本上平行的一组平行线(即该组平行线包括彼此基本上平行的至少两条平行线)上,该组平行线中的任意两条相邻平行线之间的距离大于一个像素的尺寸,并且所述至少三个像素中的至少两个像素位于该组平行线中的同一平行线上(即,该组平行线中至少一条平行线上包括两个或更多个像素)。在本公开中,上述特征向量也称为平行线段采样差分特征。作为一个示例,在图像样本或待检测图像为单通道图像(灰度图像)的情况下,像素的通道值是指该像素的亮度值(灰度值)。在这种情况下,与所提取的每一像素对应的一个或更多个通道值所构成的向量为一维向量,所得到的平行线段采样差分特征也 是一维向量。在图像为多通道图像(彩色图像或者多光谱图像)的情况下,像素的通道值是指表示该像素的各通道的值。在这种情况下,与所提取的每一像素对应的一个或更多个通道值构成的向量为一维或多维向量,相应地,所得到的平行线段采样差分特征是一维或多维向量。图5 (A)、⑶、(C)、⑶、(E)和(F)分别示意性示出了上述平行线段采样差分特征的一些具体示例。在这些示例中,以二维图像为例,各图中符号“X”所指代的有向线段表示图像中的X轴方向,图中的方块分别表示在图像中选择的像素。在图5㈧所示的示例中,选择图像中的4个像素P5A1、P5A2、P5A3和P5a4来计算平行线段采样差分特征,其中的三个像素P5A2、P5A3和P5M基本上位于一条线L5ai上,而另一像素P5A1位于与线L5ai基本上平行的另一条线(图中未绘出)上。在图5(B)所示的示例中,选择图像中的8个像素P5B1、P5B2> P5B3、P5B本文档来自技高网...

【技术保护点】
一种目标检测设备,包括:特征提取装置,用于从输入图像中提取一个或更多个特征向量,至少一个所述特征向量包括所述输入图像中的至少三个像素中的每一像素的一个或更多个通道值构成的向量的加权和,其中,所述至少三个像素位于彼此基本上平行的一组平行线上,该组平行线包含至少两条平行线,并且该组平行线中的任意两条相邻平行线之间的距离大于一个像素的尺寸,所述至少三个像素中的至少两个像素位于该组平行线中的同一平行线上;以及目标判断装置,用于利用分类器、根据所述一个或更多个特征向量来判断所述输入图像中是否存在目标。

【技术特征摘要】

【专利技术属性】
技术研发人员:张伦韩博
申请(专利权)人:索尼公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1