一种图像识别方法包括如下步骤:利用至少二种分辨率分别将窗口图像剖分为多个细胞单元;提取各个分辨率下细胞单元的梯度方向直方图;分别将同一分辨率下的所有细胞单元的梯度方向直方图结合,得到对应分辨率下窗口图像的梯度方向直方图;根据各个分辨率对应的窗口图像的梯度方向直方图和预设的判定函数,计算得到多个相似度值;根据预设的判定阀值和各个分辨率对应的相似度值,分别判定各个分辨率下窗口图像是否为目标图像;在所有分辨率下均判定窗口图像是目标图像时,最终判定窗口图像是目标图像。本发明专利技术还提供一种图像识别装置。上述方法和装置利用多种分辨率下的判定结果共同确定窗口图像是否为目标图像,以实现更高精度的图像识别。
【技术实现步骤摘要】
图像识别方法和装置
本专利技术涉及图像分析领域,特别是涉及一种图像识别方法和装置。
技术介绍
近年来,随着智能终端设备的普及,寻求一种更自然更简单的人机交互方式已然成为科研和产业领域的热点问题。纵观人机交互技术的发展历史,已逐渐从鼠标、键盘、遥控器等方式发展为视觉、语音、姿态等非接触式的操作方式,而且视觉技术作为其中最为重要的手段。即通过摄像头获取画面,基于图像智能分析技术判断操作者的动作和意图,进而控制机器。但其所面临最大的问题是环境的复杂性和不确定性,使得该技术还未完全成熟。随着3D技术的发展,微软推出了Kinect系统,其通过动态三维重建技术,将人机交互由2D的图像空间拓展到真实的3D空间,3D空间的深度信息有效的解决了2D空间中较为复杂的背景分割问题,使得该技术趋于成熟,并已应用到电视机、游戏机等设备中,用做外置的人机交互设备。传统技术的不足是:(1)基于辅助设备的手势人机交互方式:需要用户手持或者穿戴具有明显标记物的手柄或者手套,用于降低视觉检测和识别的难度,但却失去了手势操作本该具有的自然性和便利性;(2)基于视觉的手势识别操作技术:受限于其算法的稳定性和抗干扰性,当场景较为复杂或者外界光照影响较为严重时,其手势目标检测准确性和跟踪及识别的准确率急剧下降,根源于其机器学习和模式识别算法的有效性和鲁棒性;(3)基于3D技术的手势体感控制技术:以微软Kinect系统为代表的该技术通过动态三维重构技术实现了对场景的三维实时重建,将视觉检测算法由2D导入3D空间进行,降低了识别的难度,但增加了硬件成本和计算量,而且产品体积较大,很难嵌入到现有的智能终端设备中。
技术实现思路
基于传统技术的各种不足,有必要提供一种识别精度更高的图像识别方法和装置。一种图像识别方法,包括如下步骤:步骤S201,获取待检测图像;步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像;步骤S203,利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;步骤S204,提取各个分辨率下所述细胞单元的梯度方向直方图;步骤S205,分别将同一分辨率下的所有所述细胞单元的所述梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;步骤S206,根据各个分辨率对应的所述窗口图像的所述梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;步骤S207,根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;步骤S208,在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。本专利技术一较佳实施例中,所述步骤S203中所述至少二种分辨率的剖分执行顺序是从低到高的逐个执行,并且是在某一分辨率下所述步骤S207判定所述窗口图像是所述目标图像后,所述步骤S203再进行更高分辨率的剖分;当在某一分辨率下所述步骤S207判定所述窗口图像不是所述目标图像,则所述步骤S203不进行更高分辨率的剖分,此时就最终判定所述窗口图像不是所述目标图像。本专利技术一较佳实施例中,在提取所述细胞单元的梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。本专利技术一较佳实施例中,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。本专利技术一较佳实施例中,所述步骤S204中,高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。一种图像识别装置,其包括图像获取单元和截图单元,所述图像获取单元用于获取待检测图像;所述截图单元用于通过预设窗口从所述待检测图像上截取得到窗口图像;所述图像识别装置还包括:剖分单元,用于利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;提取单元,用于提取各个分辨率下所述细胞单元的梯度方向直方图;整合单元,用于分别将同一分辨率下的所有所述细胞单元的梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;计算单元,用于根据各个分辨率对应的所述窗口图像的梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;识别单元,用于根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;判定单元,用于在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。本专利技术一较佳实施例中,所述剖分单元用于从低到高的逐个执行所述至少二种分辨率的剖分,并且是在某一分辨率下所述识别单元判定所述窗口图像是所述目标图像后,再进行更高分辨率的剖分;当在某一分辨率下所述识别单元判定所述窗口图像不是所述目标图像,所述剖分单元不进行更高分辨率的剖分,此时所述判定单元用于最终判定所述窗口图像不是所述目标图像。本专利技术一较佳实施例中,所述提取单元在所述细胞单元上提取所述梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。本专利技术一较佳实施例中,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。本专利技术一较佳实施例中,所述提取单元在高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。上述图像识别方法和装置,通过多种分辨率剖分窗口图像,利用多种分辨率下的判定结果共同确定窗口图像是否为目标图像,以实现更高精度的图像识别。【附图说明】图1为一实施例的图像识别方法的步骤流程图;图2为一实施例的图像识别装置的功能模块图。【具体实施方式】为了解决传统技术图像识别精度不高的问题,提出了一种精确更高的图像识别方法和装置。在图像识别之前,首先要对目标图像建立模型表示(即挖掘显著性特征),后续检测中,将滑动得到的窗口图像的特征与模型比对,做出目标/非目标判定,实现目标检测。本专利技术是利用梯度方向直方图HOG(HistogramsofOrientedGradients)对图像进行特征描述,在特征空间中生成正类的子集和负类的子集;然后通过分片线性曲面来逼近正类和负类之间的真实分类面,而分片线性分类面是通过级联若干个线性SVM来获得的。如图1所示,其为本专利技术一实施例的图像识别方法的步骤流程图,包括如下步骤:步骤S201,获取待检测图像。如通过摄像头拍摄画面,然后提取一帧图像。假设目标图像设置的是手掌,那么图像识别即是判断拍摄的画面中是否有手掌图像。步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像。本专利技术一实施例中,预设窗口的截取方式是采用滑动穷搜的方式实现。为了检测大小不同的目标图像,可以采用固定的预设窗口,通过缩放原始图像大小来获得,又或者通过不同大小的预设窗口滑动获得。步骤S203,利用至少二种分辨率分别将窗口图像剖分本文档来自技高网...
【技术保护点】
一种图像识别方法,其特征在于,包括如下步骤:步骤S201,获取待检测图像;步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像;步骤S203,利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小步骤S204,提取各个分辨率下所述细胞单元的梯度方向直方图;.步骤S205,分别将同一分辨率下的所有所述细胞单元的所述梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;步骤S206,根据各个分辨率对应的所述窗口图像的所述梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;步骤S207,根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;步骤S208,在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像。
【技术特征摘要】
1.一种图像识别方法,其特征在于,包括如下步骤:步骤S201,获取待检测图像;步骤S202,通过预设窗口从所述待检测图像上截取得到窗口图像;步骤S203,利用至少二种分辨率分别将所述窗口图像剖分为多个细胞单元,同一种分辨率下,所述细胞单元的尺寸相同,分辨率越高,所述细胞单元尺寸越小;步骤S204,提取各个分辨率下所述细胞单元的梯度方向直方图;步骤S205,分别将同一分辨率下的所有所述细胞单元的所述梯度方向直方图结合,得到对应分辨率下所述窗口图像的梯度方向直方图;步骤S206,根据各个分辨率对应的所述窗口图像的所述梯度方向直方图和预设的判定函数,计算得到各个分辨率下所述窗口图像和目标图像的相似度值;步骤S207,根据预设的判定阀值和各个分辨率对应的所述相似度值,分别判定各个分辨率下所述窗口图像是否为所述目标图像;步骤S208,在所有分辨率下均判定所述窗口图像是所述目标图像时,最终判定所述窗口图像是所述目标图像;所述步骤S203中所述至少二种分辨率的剖分执行顺序是从低到高的逐个执行,并且是在某一分辨率下所述步骤S207判定所述窗口图像是所述目标图像后,所述步骤S203再进行更高分辨率的剖分;当在某一分辨率下所述步骤S207判定所述窗口图像不是所述目标图像,则所述步骤S203不进行更高分辨率的剖分,此时就最终判定所述窗口图像不是所述目标图像。2.根据权利要求1所述的图像识别方法,其特征在于,在提取所述细胞单元的梯度方向直方图时,一个像素点对与该像素点梯度方向相近的几个角度区间都做投票,所述像素点的梯度方向距离某个角度区间中心的距离越近则投票的权重越大,反之则越小。3.根据权利要求2所述的图像识别方法,其特征在于,当所述像素点的梯度方向距离某个角度区间中心的距离超过预设距离阈值,该像素点不对该区间进行投票。4.根据权利要求1所述的图像识别方法,其特征在于,所述步骤S204中,高分辨率下提取的所述细胞单元的梯度方向直方图的维数大于或等于低分辨率下所述细胞单元的梯度方向直方图的维数。5.一种图...
【专利技术属性】
技术研发人员:赵颜果,郑锋,宋展,
申请(专利权)人:中国科学院深圳先进技术研究院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。