物体识别方法和装置制造方法及图纸

技术编号：14564865 阅读：121 留言：0更新日期：2017-02-05 22:11

本公开提供一种物体识别方法和装置。本公开物体识别方法，包括：基于BING在待识别图像中确定至少一个第一候选框，该第一候选框用于标识待检测是否包含目标物体的图像区域；将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型；若第一候选框中存在目标物体模型，则标示第一候选框。本公开可大大减少需要比对的候选框的数目，比对次数的减少可加速物体识别过程；其中，采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小，较贴近目标物体的形状，可保证物体识别的精确度，因此，本公开可快速、精确地进行物体识别。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及图像处理，尤其涉及一种物体识别方法和装置。
技术介绍
目前，大部分物体识别方法都是先学习大量的样本，获得学习结果，即物体模型；然后用不同的框遍历需要测试的图片，将遍历的框中的内容依次与物体模型比对，确定框中是否存在此物体模型。然而，对于一幅N*N图像而言，要遍历所有可能的框，需要遍历的次数大约为N的4次方数量级。
技术实现思路
为克服相关技术中存在的问题，本公开提供一种物体识别方法和装置。所述技术方案如下：根据本公开实施例的第一方面，提供一种物体识别方法，该方法包括：基于BING方法在待识别图像中确定至少一个第一候选框，该第一候选框用于标识待检测是否包含目标物体的图像区域；将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型；若第一候选框中存在所述目标物体模型，则标示第一候选框。本公开的实施例提供的技术方案可以包括以下有益效果：通过BING方法获取可能包含目标物体的至少一个第一候选框，相对于现有技术，可大大减少需要比对的候选框的数目，因单次比对所持续的时间相对固定，因此，比对次数的减少可加速物体识别过程；将第一候选框与目标物体模型进行比对，该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型，若第一候选框中存在目标物体模型，则标示第一候选框，完成对物体的识别，其中，采用CNN对样本数据进行训练获得的目...

【技术保护点】
一种物体识别方法，其特征在于，所述方法包括：基于二值规范梯度BING方法在待识别图像中确定至少一个第一候选框，所述第一候选框用于标识待检测是否包含目标物体的图像区域；将所述第一候选框与目标物体模型进行比对，所述目标物体模型是通过采用卷积神经网络CNN对样本数据进行训练获得的关于所述目标物体的模型；若所述第一候选框中存在所述目标物体模型，则标示所述第一候选框。

【技术特征摘要】
1.一种物体识别方法，其特征在于，所述方法包括：
基于二值规范梯度BING方法在待识别图像中确定至少一个第一候选框，
所述第一候选框用于标识待检测是否包含目标物体的图像区域；
将所述第一候选框与目标物体模型进行比对，所述目标物体模型是通过
采用卷积神经网络CNN对样本数据进行训练获得的关于所述目标物体的模
型；
若所述第一候选框中存在所述目标物体模型，则标示所述第一候选框。
2.根据权利要求1所述的方法，其特征在于，所述基于二值规范梯度
BING方法在待识别图像中确定至少一个第一候选框，包括：
采用所述BING方法对待识别图像进行对象估计，获得所述待识别图像
中的至少一个第一候选框。
3.根据权利要求1或2所述的方法，其特征在于，所述将所述第一候选
框与目标物体模型进行比对之前，还包括：
对所述至少一个第一候选框进行聚类，确定第二候选框，所述第二候选
框的个数少于所述第一候选框的个数；
相应地，将所述第一候选框与目标物体模型进行比对，具体为：将所述
第二候选框与所述目标物体模型进行比对；
所述若所述第一候选框中存在所述目标物体模型，则标示所述第一候选
框，具体为：若所述第二候选框中存在所述目标物体模型，则标示所述第二
候选框。
4.根据权利要求3所述的方法，其特征在于，所述对所述至少一个第一
候选框进行聚类，确定第二候选框之前，还包括：
在所述至少一个第一候选框中，选取置信分值大于预设值的候选框，所
述置信分值用于表征候选框中包含目标物体的概率；
相应地，所述对所述至少一个第一候选框进行聚类，确定第二候选框，
包括：根据所述置信分值大于预设值的候选框的大小，对所述置信分值大于

\t预设值的候选框进行聚类，确定所述第二候选框。
5.根据权利要求4所述的方法，其特征在于，所述根据所述置信分值大
于预设值的候选框的大小，对所述置信分值大于预设值的候选框进行聚类，
确定所述第二候选框，包括：
对所述置信分值大于预设值的候选框中每两个候选框，获取两个候选框
各自左上角和右下角在所述待识别图像中位置坐标；
根据所述两个候选框各自左上角和右下角在所述待识别图像中位置坐
标，获得所述两个候选框的重合面积；
若所述两个候选框的重合面积大于预设阈值，则判定所述两个候选框为
一类；
根据聚类后的候选框，确定所述第二候选框。
6.根据权利要求5所述的方法，其特征在于，所述根据聚类后的候选框，
确定所述第二候选框，包括：
将每一类包含的候选框在所述待识别图像中的位置坐标求平均，确定每
一类包含的所有候选框的平均坐标对应的候选框为第二候选框；
或者，根据聚类后的候选框，确定每一类包含的候选框中置信分值最大
的候选框为第二候选框。
7.根据权利要求1或2所述的方法，其特征在于，所述标示所述第一候
选框之后，还包括：
向用户发出音频提示或者视频提示，以提示所述用户识别到所述目...

【专利技术属性】
技术研发人员：陈志军，李明浩，侯文迪，
申请(专利权)人：小米科技有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人