精细粒度类别识别及物体的部分定位和特征提取方法技术

技术编号：11385195 阅读：144 留言：0更新日期：2015-05-01 12:09

本发明专利技术提出了一种精细粒度类别识别及物体的部分定位和特征提取方法，该方法较好地解决了精细粒度类别识别问题中物体的部分定位问题和特征表达问题。针对物体的部分定位问题，利用有监督学习训练一系列的部分检测器，考虑到定位目标的姿态变化以及形变影响，该方法仅仅检测形变较小的部分，并且利用姿态聚类方法对同一个物体部分训练不同的检测器，从而把物体的姿态变化考虑在内。针对物体或者部分的特征表达，该方法提出在多个尺度以及多个位置提取特征，然后融合这些特征用于最终物体表达，由此使得该特征具有一定的尺度以及平移不变性。本发明专利技术的物体部分定位以及特征表达间同时具有一定的互补性，从而能够有效地提高精细类别识别问题的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种图像处理
的方法，具体地说，涉及的是一种精细粒度类别识别方法，以及该识别问题中涉及的物体的部分定位和特征提取方法。
技术介绍
精细粒度分类问题的目标是区分同一大类下的数以百计的多个子类别，比如说区分不同类别的花，鸟，狗等等。对于非专业人员来说，识别这些子类是非常困难的，精细粒度分类问题的提出解决了非专业人员识别这些相似子类的问题。用户只需要给定目标物体，通过精细类别识别方法，就可以返回目标物体的类别，进而可以获得该子类一系列特性。不同于一般类别识别问题(比如说区分车子和人)，由于子类间的差异比较小并且高度局部化，区分这些子类是非常困难的。广泛应用于一般类别识别问题的空间金字塔模型由于不能捕获这种高度局部化的子类间差异，因而不能达到满意的识别结果。经过对现有技术的文献检索发现，精细粒度分类问题的难点主要在两个方面，即部分定位以及图像描述。部分定位广泛采用的是P.Felzenszwalb在2010年《IEEE Transactions on Pattern Analysis and Machine Intelligence》上发表的``A discriminatively trained,multiscale,deformable part model”，即可变形部分模型以及它的变种。该模型通过训练模板检测器寻找目标物体或者部分目标物体，并且考虑到了部分模型之间的几何相关性。然而，该模型仅仅对形变比较...

【技术保护点】
一种精细粒度类别识别中物体的部分定位方法，其特征在于，该方法利用物体检测器和部分检测器检测目标物体以及它的形变较小部分，所述检测器是利用姿态聚类的有监督方法学习得到的，考虑到了物体或者部分的姿态变化；物体检测器和部分检测器是独立进行的，并返回每个检测器中得分高的检测区域作为候选，最终的检测结果通过校正物体和部分检测结果得到。

【技术特征摘要】
1.一种精细粒度类别识别中物体的部分定位方法，其特征在于，该方法利用物体
检测器和部分检测器检测目标物体以及它的形变较小部分，所述检测器是利用姿态聚类
的有监督方法学习得到的，考虑到了物体或者部分的姿态变化；物体检测器和部分检测
器是独立进行的，并返回每个检测器中得分高的检测区域作为候选，最终的检测结果通
过校正物体和部分检测结果得到。
2.根据权利要求1所述的物体的部分定位方法，其特征在于，所述检测器是利用
姿态聚类的有监督方法学习得到的，具体为：对于物体以及每一个部分，根据姿态聚集
正例样本到一些混合模型；
假设每一个部分pi都用一个边界框定义，整个物体以边界框
p0表达，其中(l，t，r，b)表示边界框的左侧，顶部，右侧以及底部坐标位置；通...

【专利技术属性】
技术研发人员：熊红凯，张晓鹏，
申请(专利权)人：上海交通大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人