物体识别方法和装置制造方法及图纸

技术编号:14564865 阅读:108 留言:0更新日期:2017-02-05 22:11
本公开提供一种物体识别方法和装置。本公开物体识别方法,包括:基于BING在待识别图像中确定至少一个第一候选框,该第一候选框用于标识待检测是否包含目标物体的图像区域;将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型;若第一候选框中存在目标物体模型,则标示第一候选框。本公开可大大减少需要比对的候选框的数目,比对次数的减少可加速物体识别过程;其中,采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小,较贴近目标物体的形状,可保证物体识别的精确度,因此,本公开可快速、精确地进行物体识别。

【技术实现步骤摘要】

本公开涉及图像处理,尤其涉及一种物体识别方法和装置
技术介绍
目前,大部分物体识别方法都是先学习大量的样本,获得学习结果,即物体模型;然后用不同的框遍历需要测试的图片,将遍历的框中的内容依次与物体模型比对,确定框中是否存在此物体模型。然而,对于一幅N*N图像而言,要遍历所有可能的框,需要遍历的次数大约为N的4次方数量级。
技术实现思路
为克服相关技术中存在的问题,本公开提供一种物体识别方法和装置。所述技术方案如下:根据本公开实施例的第一方面,提供一种物体识别方法,该方法包括:基于BING方法在待识别图像中确定至少一个第一候选框,该第一候选框用于标识待检测是否包含目标物体的图像区域;将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型;若第一候选框中存在所述目标物体模型,则标示第一候选框。本公开的实施例提供的技术方案可以包括以下有益效果:通过BING方法获取可能包含目标物体的至少一个第一候选框,相对于现有技术,可大大减少需要比对的候选框的数目,因单次比对所持续的时间相对固定,因此,比对次数的减少可加速物体识别过程;将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型,若第一候选框中存在目标物体模型,则标示第一候选框,完成对物体的识别,其中,采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小,较贴近目标物体的形状,可保证物体识别的精确度,因此,本公开可快速、精确地进行物体识别。可选地,上述基于BING方法在待识别图像中确定至少一个第一候选框,包括:采用BING方法对待识别图像进行对象估计,获得该待识别图像中的至少一个第一候选框。进一步地,上述将第一候选框与目标物体模型进行比对之前,还包括:对至少一个第一候选框进行聚类,确定第二候选框。该第二候选框的个数少于第一候选框的个数。相应地,上述将第一候选框与目标物体模型进行比对,具体为:将第二候选框与目标物体模型进行比对。上述若第一候选框中存在目标物体模型,则标示第一候选框,具体为:若第二候选框中存在目标物体模型,则标示第二候选框。本公开的实施例提供的技术方案可以包括以下有益效果:通过对至少一个第一候选框进行聚类确定第二候选框,进一步减少需比对的候选框的个数,完成物体识别过程所消耗的时间更少,提升用户体验。进一步地,上述对至少一个第一候选框进行聚类,确定第二候选框之前,还包括:在至少一个第一候选框中,选取置信分值大于预设值的候选框。该置信分值用于表征候选框中包含目标物体的概率。相应地,上述对至少一个第一候选框进行聚类,确定第二候选框,包括:根据置信分值大于预设值的候选框的大小,对置信分值大于预设值的候选框进行聚类,确定第二候选框。其中,上述根据置信分值大于预设值的候选框的大小,对置信分值大于预设值的候选框进行聚类,确定第二候选框,包括:对置信分值大于预设值的候选框中每两个候选框,获取两个候选框各自左上角和右下角在待识别图像中位置坐标;根据两个候选框各自左上角和右下角在所述待识别图像中位置坐标,获得两个候选框的重合面积;若两个候选框的重合面积大于预设阈值,则判定两个候选框为一类;根据聚类后的候选框,确定第二候选框。进一步地,上述根据聚类后的候选框,确定第二候选框,可以通过多种方式实现。一种实现方式中,根据聚类后的候选框,确定第二候选框可以包括:将每一类包含的候选框在待识别图像中的位置坐标求平均,确定每一类包含的所有候选框的平均坐标对应的候选框为第二候选框。例如,类1中每个候选框的左上角和右下角在待识别图像中位置坐标是已知的,对类1中所有候选框的左上角在待识别图像中位置坐标求平均值,获得类1包含的所有候选框的左上角在待识别图像中平均位置坐标;同理,对类1中所有候选框的右下角在待识别图像中位置坐标求平均值,获得类1包含的所有候选框的右下角在待识别图像中平均位置坐标,该两个平均位置坐标对应的候选框即为根据类1中所有候选框确定的第二候选框。另一种实现方式中,根据聚类后的候选框,确定第二候选框可以包括:根据聚类后的候选框,确定每一类包含的候选框中置信分值最大的候选框为第二候选框。这里仍以类1为例进行说明,其中,类1包含的候选框中,每一候选框对应的置信分值可能是不同的,确定对应置信分值最大的候选框作为类1的第二候选框。同理,在类2包含的候选框中,确定对应置信分值最大的候选框作为类2的第二候选框。以此类推,确定每一类的第二候选框。进一步地,上述标示第一候选框之后,还包括:向用户发出音频提示或者视频提示,以提示用户识别到目标物体。本公开的实施例提供的技术方案可以包括以下有益效果:通过多样的提示方式,可以使得用户采用各种方式获取到识别到物体的提示信息,增加用户兴趣,提升用户体验。根据本公开实施例的第二方面,提供一种物体识别装置,所述装置包括:获取模块,被配置为基于BING方法在待识别图像中确定至少一个第一候选框,该第一候选框用于标识待检测是否包含目标物体的图像区域;比对模块,被配置为将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型;标示模块,被配置为若第一候选框中存在目标物体模型,则标示第一候选框。本公开的实施例提供的技术方案可以包括以下有益效果:通过BING方法获取可能包含目标物体的至少一个第一候选框,相对于现有技术,可大大减少需要比对的候选框的数目,因单次比对所持续的时间相对固定,因此,比对次数的减少可加速物体识别过程;将第一候选框与目标物体模型进行比对,该目标物体模型是通过采用CNN对样本数据进行训练获得的关于目标物体的模型,若第一候选框中存在目标物体模型,则标示第一候选框,完成对物体的识别,其中,采用CNN对样本数据进行训练获得的目标物体模型与目标物体的差别较小,较贴近目标物体的形状,可保证物体识别的精确度,因此,本公开可快速、精确地进行物体识别。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。附图说明为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不本文档来自技高网...

【技术保护点】
一种物体识别方法,其特征在于,所述方法包括:基于二值规范梯度BING方法在待识别图像中确定至少一个第一候选框,所述第一候选框用于标识待检测是否包含目标物体的图像区域;将所述第一候选框与目标物体模型进行比对,所述目标物体模型是通过采用卷积神经网络CNN对样本数据进行训练获得的关于所述目标物体的模型;若所述第一候选框中存在所述目标物体模型,则标示所述第一候选框。

【技术特征摘要】
1.一种物体识别方法,其特征在于,所述方法包括:
基于二值规范梯度BING方法在待识别图像中确定至少一个第一候选框,
所述第一候选框用于标识待检测是否包含目标物体的图像区域;
将所述第一候选框与目标物体模型进行比对,所述目标物体模型是通过
采用卷积神经网络CNN对样本数据进行训练获得的关于所述目标物体的模
型;
若所述第一候选框中存在所述目标物体模型,则标示所述第一候选框。
2.根据权利要求1所述的方法,其特征在于,所述基于二值规范梯度
BING方法在待识别图像中确定至少一个第一候选框,包括:
采用所述BING方法对待识别图像进行对象估计,获得所述待识别图像
中的至少一个第一候选框。
3.根据权利要求1或2所述的方法,其特征在于,所述将所述第一候选
框与目标物体模型进行比对之前,还包括:
对所述至少一个第一候选框进行聚类,确定第二候选框,所述第二候选
框的个数少于所述第一候选框的个数;
相应地,将所述第一候选框与目标物体模型进行比对,具体为:将所述
第二候选框与所述目标物体模型进行比对;
所述若所述第一候选框中存在所述目标物体模型,则标示所述第一候选
框,具体为:若所述第二候选框中存在所述目标物体模型,则标示所述第二
候选框。
4.根据权利要求3所述的方法,其特征在于,所述对所述至少一个第一
候选框进行聚类,确定第二候选框之前,还包括:
在所述至少一个第一候选框中,选取置信分值大于预设值的候选框,所
述置信分值用于表征候选框中包含目标物体的概率;
相应地,所述对所述至少一个第一候选框进行聚类,确定第二候选框,
包括:根据所述置信分值大于预设值的候选框的大小,对所述置信分值大于

\t预设值的候选框进行聚类,确定所述第二候选框。
5.根据权利要求4所述的方法,其特征在于,所述根据所述置信分值大
于预设值的候选框的大小,对所述置信分值大于预设值的候选框进行聚类,
确定所述第二候选框,包括:
对所述置信分值大于预设值的候选框中每两个候选框,获取两个候选框
各自左上角和右下角在所述待识别图像中位置坐标;
根据所述两个候选框各自左上角和右下角在所述待识别图像中位置坐
标,获得所述两个候选框的重合面积;
若所述两个候选框的重合面积大于预设阈值,则判定所述两个候选框为
一类;
根据聚类后的候选框,确定所述第二候选框。
6.根据权利要求5所述的方法,其特征在于,所述根据聚类后的候选框,
确定所述第二候选框,包括:
将每一类包含的候选框在所述待识别图像中的位置坐标求平均,确定每
一类包含的所有候选框的平均坐标对应的候选框为第二候选框;
或者,根据聚类后的候选框,确定每一类包含的候选框中置信分值最大
的候选框为第二候选框。
7.根据权利要求1或2所述的方法,其特征在于,所述标示所述第一候
选框之后,还包括:
向用户发出音频提示或者视频提示,以提示所述用户识别到所述目...

【专利技术属性】
技术研发人员:陈志军李明浩侯文迪
申请(专利权)人:小米科技有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1