一种基于图像中层特征的场景分类方法技术

技术编号:13063632 阅读:108 留言:0更新日期:2016-03-24 02:00
本发明专利技术公开了一种基于图像中层特征的场景分类方法,属于场景图像分类领域。首先利用一种快速查找图像中物体区域的方法,得到物体区域图像块,并将得到的区域图像块作为图像的中层特征。然后对中层特征图像块进行聚类,并利用SVM为每个聚类训练一个形状模板,同时根据评级指标,选取评级得分最高的n个形状模板。最后,根据测试图像与n个形状模板的匹配得分实现场景图像分类。本发明专利技术解决了场景图像分类中图像鉴别性不足和代表性不强的问题。

【技术实现步骤摘要】

本专利技术涉及一种图像分类方法,尤其是一种基于图像中层特征学习的场景图像分 类方法,用于室内及室外自然场景图像的分类。
技术介绍
目前,随着越来越多智能移动机器人走进人们的日常生活,并在军事、商场、医院、 家庭等各种领域发挥重要作用,人们对智能移动机器人系统的自动定位需求越来越迫切。 移动机器人只有准确地知道自身的位置以及所处的工作空间,才能安全有效地进行自主运 动,为人类服务。场景图像分类作为图像理解的重要研究内容,是机器视觉和模式识别领域 的重要研究问题。应用于移动机器人的场景图像分类,旨在使机器人能够像人一样认知和 理解场景所包含的语义信息,以增强移动机器人对场景理解的能力。其难点在于如何有效 地区分场景类内的差异性和场景类间的相似性。 基于场景识别的机器人视觉自定位方法使用人类能够直接理解的高层语义信息 如"走廊"、"厨房"等作为视觉特征,非常适合于机器人在复杂环境中的自定位问题。李桂 芝等 使用多通道Gabor滤波器提取场景图像的全局纹理特征,并使用支持向量机来分类 识别室内、走廊、门厅等场景,进而实现机器人的逻辑定位。Ullah等使用Harris角点特 征检测子和SIFT特征描述子提取局部特征,并使用支持向量机作为分类器实现基于局部 特征的地点识别。局部特征虽然在精确特征匹配方面能够获得较好的效果,但是由于缺乏 中高层语义,导致推广能力不尽人意。 在日常生活中,人类的视觉系统总能够寻找场景中最具代表性的某些区域来进行 对场景的理解和识别。即人类视觉系统能够快速地从场景图像中提取表征场景内容的中层 特征。与底层特征相比,由于图像的中层特征更接近于人类认知场景的行为过程,近几年, 基于中层特征的图像分类吸引越来越多的研究人员的注意。图像中层特征与图像的低层特 征相比,包含的信息更加丰富,更适合描述现实世界的表象分布,同时也不需要高层特征实 体的语义基础。所以,将中层特征应用于场景分类领域,具有巨大的优势和潜力。 参考文献: 李桂芝,安成万,杨国盛等.基于场景识别的移动机器人定位方法研究. 机器人,2005, 27 (2) : 123-127 UllahMM,PronobisA?CaputoB?etal.Towardsrobustplacerecognition forrobotlocalization.InProc.ofIEEEICRA. 2008:530-537 Ming-MingCheng,ZimingZhang,Wen-YanLin,PhilipTorr,BING:Binarized NormedGradientsforObjectnessEstimationat300fps.InProc.ofIEEECVPR, 2014. S.Singh,A.Gupta,andA.A.Efros.Unsuperviseddiscoveryofmid-level discriminativepatches.InProc.ofECCV,2012. DalaiN,TriggsB.Histogramsoforientedgradientsforhuman detection.InProc.ofIEEECVPR2005,1:886-893.
技术实现思路
本专利技术的目的在于提供一种基于中层特征学习的图像分类方法,利用中层特征更 好地模拟人类的视觉特性,以解决图像分类中图像鉴别性不足和代表性不强的问题。即要 使分类得到的物体图像满足出现频率高,且和其他视觉物体具有显著区别,又可以在大量 图片中以较高的召回率和精确率检测出来。为了达到上述目的,本专利技术所采用的技术方案 是:首先利用一种快速查找图像中近似物体区域(可能存在物体的区域)的学习方法,得到 近似区域图像块,并将得到的图像块作为图像的中层特征特征。然后,在得到的大量中层特 征的基础上,基于支持向量机设计分类算法,实现场景的分类,为了进一步提高分类效果, 定义评价指标函数,优化分类结果。 本专利技术是采用以下技术手段实现的: -种基于图像中层特征的场景分类方法,其实现过程包括以下步骤: 步骤1 :图像中层特征学习 步骤1. 1 :利用安装于机器人平台的摄像机采集场景图像,得到训练图像和:测试 图像。对训练图像标注物体区域,并将标注区域的图像块尺寸缩放至为8X8像素区域,计 算该区域的64维梯度范数特征。随机采样图像非标注区域,得到的图像块同样进行尺寸缩 放至8X8像素区域,并计算其64维梯度范数特征; 步骤1. 2 :将标注区域得到的梯度范数特征作为物体模板训练的正样本,非标注 区域得到的梯度范数特征作为物体模板训练的负样本,利用线性支持向量机训练得到一个 64维的模板向量weRsxs; 步骤1. 3 :对模版向量w进行二值化,方法如下: 输入:w,Nw; 初始化残差:ε=w; 循环开始:j= 1到Nw aj=sign(ε) β.〗= < a .j,ε >/I |a.j| I ε-ε-β々j; 循环结束 输出:{A}:-V 其中Nw表示基向量的个数,a# {-1,1} 64表示基向量,其中j= 1,. . .,NW,h表 示基向量对应的系数,最终可将模版向量w表示成为如下形式:(1) 用二进制向量进一步表示a,,可得: =α)-α] 其中e1〇,l]·64,《丨表示对< 取反运算。模板向量w与模板向量w的二值化向 量b的点积就可由下式表示:(2)由于一个十进制数可以由其二进制数的最高几位来近似,则二值化64维的梯度 范数特征近似表示为:C.3) 其中,Ng为十进制数所对应的二进制数的高位个数,b k(k = 1,. . .,Ng)表示二值 化数值中的第k个高位的数值。 步骤1.4 :将测试图像集中的图像压缩至IXH。尺寸,其中{WaXH。}表示图像的尺 寸,其中WQXHQe{10, 20, 40, 80, 160, 320},共有 36 种; 步骤1. 5 :在各种尺寸的图像下,计算每幅图像的二值化梯度范数特征,利用8X8 大小的窗口进行滑动扫描,计算得到每个窗口的二值化梯度范数特征gl,则在位置1处的二 值化梯度范数与模板匹配得分可表示为s1: Sl = <w, gl> (4) 1 = (i,x,y) (5) 其中1表示位置信息,i表示缩放后图像的尺寸,(x,y)表示图像的坐标值。公式 (4)可表示为: 步骤1.6:将缩放得到的36种不同尺寸的图像按比例缩放为原图像尺寸,就可以 得到物体的区域。尽管得到的物体区域尺寸大小各异,然而对于一般的物体,其尺寸长宽比 不会过大,所以我们对上述步骤得到的物体区域进行提纯。对缩放得到的36种不同大小、 匹配得分以及提纯后最终物体的得分这三者的关系建立线性模型,即利用公式(7)计算得 到提纯后的最终物体的得分。每种窗口大小选择Μ个得分最高的作为最终物体区域: 〇!=¥;· Sj+t;(7) 上式中的Vl,h为线性模型的参数,t误差项。这两个参数可用线性支持向量 机学习得到。即用36种不同尺寸图像中在位置1处的二值化梯度范数与模板匹配得分作 为训练样本,利用线性支持向量机的方法训练得到Vl,t1<3 步骤2 :基于中层特征场景分类 步骤2. 1 :将以上"图像中层特征学习本文档来自技高网
...

【技术保护点】
一种基于图像中层特征的场景分类方法,其特征在于:该方法的实现过程包括以下步骤,步骤1:图像中层特征学习步骤1.1:利用安装于机器人平台的摄像机采集场景图像,得到训练图像和:测试图像;对训练图像标注物体区域,并将标注区域的图像块尺寸缩放至为8×8像素区域,计算该区域的64维梯度范数特征;随机采样图像非标注区域,得到的图像块同样进行尺寸缩放至8×8像素区域,并计算其64维梯度范数特征;步骤1.2:将标注区域得到的梯度范数特征作为物体模板训练的正样本,非标注区域得到的梯度范数特征作为物体模板训练的负样本,利用线性支持向量机训练得到一个64维的模板向量w∈R8×8;步骤1.3:对模版向量w进行二值化,方法如下:输入:w,Nw;初始化残差:ε=w;循环开始:j=1到Nwaj=sign(ε)βj=<aj,ε>/||aj||ε←ε‑βjaj;循环结束输出:{βj}j=1Nw,{aj}j=1Nw]]>其中Nw表示基向量的个数,aj∈{‑1,1}64表示基向量,其中j=1,...,Nw,βj表示基向量对应的系数,最终可将模版向量w表示成为如下形式:w≈Σj=1Nwβjaj---(1)]]>用二进制向量进一步表示aj,可得:aj=aj+-aj+‾]]>其中表示对取反运算;模板向量w与模板向量w的二值化向量b的点积就可由下式表示:<w,b>≈Σj=1Nwβj(2<aj+,b>-|b|)---(2)]]>由于一个十进制数可以由其二进制数的最高几位来近似,则二值化64维的梯度范数特征可以近似表示为:gl=Σk=1Ng28-kbk---(3)]]>其中,Ng为十进制数所对应的二进制数的高位个数,bk(k=1,...,Ng)表示二值化数值中的第k个高位的数值;步骤1.4:将测试图像集中的图像压缩至W0×H0尺寸,其中{W0×H0}表示图像的尺寸,其中W0×H0∈{10,20,40,80,160,320},共有36种;步骤1.5:在各种尺寸的图像下,计算每幅图像的二值化梯度范数特征,利用8×8大小的窗口进行滑动扫描,计算得到每个窗口的二值化梯度范数特征gl,则在位置l处的二值化梯度范数与模板匹配得分可表示为sl:sl=<w,gl>                          (4)l=(i,x,y)                       (5)其中l表示位置信息,i表示缩放后图像的尺寸,(x,y)表示图像的坐标值;公式(4)可表示为:sl≈Σj=1NwβjΣk=1NgCj,k---(6)]]>其中Cj,k=28-k(2<aj+,bk>-|bk|);]]>步骤1.6:将缩放得到的36种不同尺寸的图像按比例缩放为原图像尺寸,就可以得到物体的区域;尽管得到的物体区域尺寸大小各异,然而对于一般的物体,其尺寸长宽比不会过大,所以我们对上述步骤得到的物体区域进行提纯;对缩放得到的36种不同大小、匹配得分以及提纯后最终物体的得分这三者的关系建立线性模型,即利用公式(7)计算得到提纯后的最终物体的得分;每种窗口大小选择M个得分最高的作为最终物体区域:Ol=vi·sl+ti                     (7)上式中的vi,ti为线性模型的参数,ti为误差项;这两个参数可用线性支持向量机学习得到;即用36种不同尺寸图像中在位置l处的二值化梯度范数与模板匹配得分作为训练样本,利用线性支持向量机的方法训练得到vi,ti;步骤2:基于中层特征场景分类步骤2.1:将以上“图像中层特征学习步骤”得到的中层特征作为分类器的训练集H,将H分为A和B两部分;步骤2.2:统计集合H中所有图像块的大小,按图像块尺寸大小进行排序后,找出图像尺寸的中位数a×b,并将集合H中所有图像缩放至a×b大小,在该尺度下计算各个图像块的方向梯度直方图(HOG)特征,计算方法如下:(1)将图像灰度化,并计算图像每个像素的梯度信息;(2)将图像划分成若干个8×8像素的细胞单元,对每个细胞单元360度的梯度方向分成9个方向块,并进行细胞单元内像素的规定权重投影,得到细胞单元的梯度直方图;(3)将相邻的若干细胞单元组成一个区域,并串联图像内所有区域的梯度直方图,得到整个图像的HOG特征;步骤2.3:用k‑means算法对预处理过的样本集A的HOG特征进行聚类,并将聚类结果去掉聚类中含有图像块少于k个的类;步骤2.4:分别选取每个聚类中的图像作块为正样本,其他聚类中图像块作为负样本,利用线性支持向量机学习一个形状模板,并用该类的形状模板在其他聚类中进行扫描,取得分最高的m个图像块来更新每个聚类,在此基础上重新训练得到新的形状模板;步...

【技术特征摘要】

【专利技术属性】
技术研发人员:杨金福张强张珊珊陈浩
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1