精细粒度类别识别及物体的部分定位和特征提取方法技术

技术编号:11385195 阅读:124 留言:0更新日期:2015-05-01 12:09
本发明专利技术提出了一种精细粒度类别识别及物体的部分定位和特征提取方法,该方法较好地解决了精细粒度类别识别问题中物体的部分定位问题和特征表达问题。针对物体的部分定位问题,利用有监督学习训练一系列的部分检测器,考虑到定位目标的姿态变化以及形变影响,该方法仅仅检测形变较小的部分,并且利用姿态聚类方法对同一个物体部分训练不同的检测器,从而把物体的姿态变化考虑在内。针对物体或者部分的特征表达,该方法提出在多个尺度以及多个位置提取特征,然后融合这些特征用于最终物体表达,由此使得该特征具有一定的尺度以及平移不变性。本发明专利技术的物体部分定位以及特征表达间同时具有一定的互补性,从而能够有效地提高精细类别识别问题的精度。

【技术实现步骤摘要】

本专利技术涉及一种图像处理
的方法,具体地说,涉及的是一种精细粒度类别识别方法,以及该识别问题中涉及的物体的部分定位和特征提取方法。
技术介绍
精细粒度分类问题的目标是区分同一大类下的数以百计的多个子类别,比如说区分不同类别的花,鸟,狗等等。对于非专业人员来说,识别这些子类是非常困难的,精细粒度分类问题的提出解决了非专业人员识别这些相似子类的问题。用户只需要给定目标物体,通过精细类别识别方法,就可以返回目标物体的类别,进而可以获得该子类一系列特性。不同于一般类别识别问题(比如说区分车子和人),由于子类间的差异比较小并且高度局部化,区分这些子类是非常困难的。广泛应用于一般类别识别问题的空间金字塔模型由于不能捕获这种高度局部化的子类间差异,因而不能达到满意的识别结果。经过对现有技术的文献检索发现,精细粒度分类问题的难点主要在两个方面,即部分定位以及图像描述。部分定位广泛采用的是P.Felzenszwalb在2010年《IEEE Transactions on Pattern Analysis and Machine Intelligence》上发表的``A discriminatively trained,multiscale,deformable part model”,即可变形部分模型以及它的变种。该模型通过训练模板检测器寻找目标物体或者部分目标物体,并且考虑到了部分模型之间的几何相关性。然而,该模型仅仅对形变比较小的部分具有较好的检测效果,对形变比较大的部分,诸如鸟的翅膀,部分检测模型的性能很差。针对图像描述,大多采用D.G.Lowe在2004年发表在《International Journal of Computer Vision》上的``Distinctive image features from scale-invariant keypoints”,即尺度不变特征。然而,该特征仅仅是一些梯度信息的组合,独立于具体的数据集,不具备较好的区分能力。其他的特征诸如Krizhevsky在2010年发表在《Neural Information Processing Systems》上的``Imagenet classification with deep convolutional neural networks”,即卷及神经网络特征,该特征尽管是针对数据设计的语义丰富的特征,但却缺乏足够的尺度以及平移不变性。当检测的部分物体与真实位置有较大偏差时,该特征不能很好的克服这种平移变化。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种精细粒度类别识别及其物体的部分定位和特征提取方法,提高部分定位的精度以及特征表达的尺度不变性以及平移不变性,从而提高精细类别分类问题的识别精度。本专利技术是通过以下技术方案实现的:根据本专利技术的第一方面,提供一种物体的部分定位方法,是一种针对精细粒度分类的部分定位方法,该方法利用物体检测器和部分检测器检测目标物体以及它的形变较小部分,所述检测器是利用姿态聚类的有监督方法学习得到的,考虑到了物体或者部分的姿态变化;物体检测器和部分检测器是独立进行的,并返回每个检测器中得分高的检测区域作为候选,最终的检测结果通过校正物体和部分检测结果得到。优选的,所述检测器是利用姿态聚类的有监督方法学习得到的,具体为:对于物体以及每一个部分,根据姿态聚集正例样本到一些混合模型;假设每一个部分pi都用一个边界框定义,整个物体以边界框p0表达,其中(l,t,r,b)表示边界框的左侧,顶部,右侧以及底部坐标位置;通过如下向量,这些标定的部分用来参数化样本I的姿态θI:θI=(p′1,p′2,...,p′n)pi′=(pil+pir2w,pit+pib2h),i=1,2,...,n]]>其中,w和h表示物体p0的宽度和高度,n表示物体部分的数量.p′i是pi的归一化表达,这种归一化的表达使得可以仅仅考虑部分的相对位置,而忽略不同物体部分之间的尺度差异;所有的正样本依据姿态特性,利用k-均值聚类方法聚类成C个成分。进一步的,为解决返回的检测结果中物体部分有可能与物体的位置不一致,所述物体检测器和部分检测器返回每个检测器中得分高的检测区域作为候选,具体为:令X={x0,x1,...,xn本文档来自技高网
...

【技术保护点】
一种精细粒度类别识别中物体的部分定位方法,其特征在于,该方法利用物体检测器和部分检测器检测目标物体以及它的形变较小部分,所述检测器是利用姿态聚类的有监督方法学习得到的,考虑到了物体或者部分的姿态变化;物体检测器和部分检测器是独立进行的,并返回每个检测器中得分高的检测区域作为候选,最终的检测结果通过校正物体和部分检测结果得到。

【技术特征摘要】
1.一种精细粒度类别识别中物体的部分定位方法,其特征在于,该方法利用物体
检测器和部分检测器检测目标物体以及它的形变较小部分,所述检测器是利用姿态聚类
的有监督方法学习得到的,考虑到了物体或者部分的姿态变化;物体检测器和部分检测
器是独立进行的,并返回每个检测器中得分高的检测区域作为候选,最终的检测结果通
过校正物体和部分检测结果得到。
2.根据权利要求1所述的物体的部分定位方法,其特征在于,所述检测器是利用
姿态聚类的有监督方法学习得到的,具体为:对于物体以及每一个部分,根据姿态聚集
正例样本到一些混合模型;
假设每一个部分pi都用一个边界框定义,整个物体以边界框
p0表达,其中(l,t,r,b)表示边界框的左侧,顶部,右侧以及底部坐标位置;通...

【专利技术属性】
技术研发人员:熊红凯张晓鹏
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1