滤波器组训练方法及系统和图像关键点定位方法及系统技术方案

技术编号:10283035 阅读:180 留言:0更新日期:2014-08-04 11:28
本发明专利技术涉及滤波器组训练方法,包括步骤1:将已有目标位置标注的训练图像进行预处理,得到去噪训练图像;步骤2:对去噪训练图像集进行初始聚类,分解成K个训练集合;步骤3:根据训练图像中的目标位置标注设计出理想滤波输出模型;步骤4:根据理想滤波输出模型训练得到K个总滤波器模型构成滤波器组;步骤5:判断图像样本集是否收敛,如果是,执行步骤7;否则,执行步骤6;步骤6:当前判断收敛的次数是否达到预设阈值,如果是,执行步骤7;否则,重新分类,得到K个新训练集合,K个新训练集合替代K个训练集合,返回步骤4;步骤7:存储滤波器组,完成滤波器组训练过程。对目标有更好的区分性,使定位在准确率和精度上都有一定程度的提升。

【技术实现步骤摘要】
滤波器组训练方法及系统和图像关键点定位方法及系统
本专利技术涉及一种图像处理技术,尤其涉及滤波器组训练方法及系统和图像关键点定位方法及系统,属于图像关键点定位装置,尤其适用于图像或视频中的人脸、行人等目标的关键点定位。
技术介绍
现有图像关键点定位的方法主要分为基于目标特征的方法、基于统计的方法以及混合方法三大类。基于目标特征的方法根据特征点目标的固有特征在图像上对其进行区分,从而实现定位功能,常见的特征有形状、强度对比、纹理等。Yuille等人提出的一种可变形模型来进行人目艮定位(参见 A.L.Yuille, P.W.Hallinan, D.S.Cohen, Feature extraction fromfaces using deformable template, International Journal of Computer Vision8(2)(1992)99 - 111.),将人眼的形状表示为数学化的参数模型,在定位时选取所有符合这一模型的目标作为定位点。在复杂或不受控环境下,由于特征变化剧烈,对特征的描述往往无法做到普适性,因此基于目标特征的方法在这种环境下的可行性不高,限制了其在实际场景中的应用。基于统计的方法通过对大量的训练数据进行学习,得到相应目标的统计模型或特征,并根据这一模型或特征进行目标定位。一种著名的基于检测器的定位方法是将Viola和Jones的人脸识别级联分类器方法应用于关键点检测(参见P.Viola, Μ.J.Jones.Robust real-time face detection.1nternational Journal of ComputerVision, 2004,57 (2): 137 - 154.),检测分类器的方法的优势在于进行目标的检测与分类,而在处理特征的精准定位上性能不理想。相比于釆用分类的方法,釆用回归的思想直接将目标位置与训练图片结合起来,可以进一步提高定位精度。2009年Bolme等人提出釆用平均合成精确滤波(Average Synthetic Exact Filter,ASEF)(参见 D.S.Bolme,B.A.Draper, J.R.Beveridge.Average of synthetic exact filters.1n IEEE Conf.Computer Vision and Pattern Recognition,pages2105 - 2112,2009.)的方法进行人眼定位,他们在训练中利用输入样本图像和合成输出结果对在频域上构造相关滤波器,然后将多个滤波器进行平均,得到最终的相关滤波器;釆用训练的滤波器进行定位,得到了较好的结果,但是当样本不多时,定位性能下降很多。为了解决这一问题,他们在2010年又提出了最小输出平方误差和(Minimum Output Sum Of Squared Error,M0SSE)滤波器(参JAL D.S.Bolmej J.R.Beveridge, B.A.Draper, and Y.M.Lu1.Visual object tracking usingadaptive correlation filters.1n IEEE Conf.Computer Vision and Pat—tern Recognition, pages2544 - 2550,2010.),利用较少的输入样本和合成输出组对通过约束一个统一的输出误差平方和损失函数,来构造一个的相关滤波器模板,以提升样本较少时的定位准确性问题。2013年,Hamed等人提出了多通道的相关滤波器(Mult1-Channel CorrelationFilters)(参 见 Hamed Kiani galoogahi,Terence Sim, Simon Lucey.Mult1-ChannelCorrela-tion Filters.1CCV, 2013.),利用训练图片的不同通道来进行滤波器的训练,实现了人脸关键点定位性能的提升。但目前基于统计的方法通常只训练一个模型,当所需定位的目标与统计模型很契合的情况下可以得到很好的结果,但是如果契合度不是太高或者检测范围内有其他契合度较高的目标时,效果就不是十分理想。混合方法则是将关键点目标的结构信息融入到训练统计模型中,从而提高定位精度。混合方法通常用来进行多目标的特征点定位,通过引入结构信息,混合方法能够通过结构中部分特征点位置信息来估计其余特征点位置,因此在处理遮挡问题时具有一定优势。采用这一思路典型的有:X.Tan等人提出的用来进行人眼定位的增强图像结构(参见 X.Tan, F.Song, Z.Zhou, S.Chen, “Enhanced pictorial structures for preciseeyelocalization under uncontrolled conditions, ,,IEEE Conference on Computer Visionand Pattern Recognition, pp.1621-1628,2009.),Matthews 等人提出的 AAM 模型(参见1.Matthews and S.Baker, “Active appearance models revisited,,,Interna-tionalJourney of Computer Vision, vol.60 (2), pp.135-164, 2004.)等。但采用混合方法需要结合目标结构信息进行定位,在处理单点定位时由于缺少相关信息,其效果反而往往不如基于统计的方法。
技术实现思路
本专利技术所要解决的技术问题是,现有的传统滤波器均是采用单一的滤波器模板来对所有的图像进行统一的滤波处理,由于所需定位目标在个图像之间存在着很多外观、形态的变化以及噪声的影响,使得单一的滤波器模板很难应付目标在不同图像间在外观、表情、姿态等的差异;本专利技术的目的就是要更好的解决目标在不同图像之间的差异所造成的定位不准确问题,提供一种滤波器组训练方法及系统和图像关键点定位方法及系统。本专利技术解决上述技术问题的技术方案如下:滤波器组训练方法,具体包括以下步骤:步骤1:预处理模块将已有目标位置标注的训练图像进行预处理,得到减少光照和阴影影响的去噪训练图像集;步骤2:聚类模块对去噪训练图像集进行初始聚类,使去噪训练图像集按外观分解成K个训练集合;步骤3:理想滤波设计模块根据步骤I所述的训练图像中的目标位置标注设计出理想滤波输出模型,且理想滤波输出模型中的目标位置处于峰值,而在除目标位置外的其他位置接近零;步骤4:应用K个训练集合训练理想滤波输出模型得到对应K个训练集合的K个总滤波器模型和K个图像样本,K个总滤波器模型构成滤波器组,K个图像样本构成图像样本集;步骤5:判断图像样本集是否收敛,如果是,执行步骤7 ;否则,执行步骤6 ;步骤6:检查当前判断收敛的次数是否达到预设阈值,如果是,执行步骤7 ;否则,对去噪训练图像进行重新分类,得到K个新训练集合,K个新训练集合替代K个训练集合,返回步骤4 ;步骤7:存储滤波器组,完成滤波器组训练过程。本专利技术的有益效果是:本专利技术与传统的采用单一相关滤波器的方本文档来自技高网
...

【技术保护点】
一种滤波器组训练方法,其特征在于,具体包括以下步骤:步骤1:预处理模块将已有目标位置标注的训练图像进行预处理,得到减少光照和阴影影响的去噪训练图像集;步骤2:聚类模块对去噪训练图像集进行初始聚类,使去噪训练图像集按外观分解成K个训练集合;步骤3:理想滤波设计模块根据步骤1所述的训练图像中的目标位置标注设计出理想滤波输出模型,且理想滤波输出模型中的目标位置处于峰值,而在除目标位置外的其他位置接近零;步骤4:应用K个训练集合训练理想滤波输出模型得到对应K个训练集合的K个总滤波器模型和K个图像样本,K个总滤波器模型构成滤波器组,K个图像样本构成图像样本集;步骤5:判断图像样本集是否收敛,如果是,执行步骤7;否则,执行步骤6;步骤6:检查当前判断收敛的次数是否达到预设阈值,如果是,执行步骤7;否则,对去噪训练图像进行重新分类,得到K个新训练集合,K个新训练集合替代K个训练集合,返回步骤4;步骤7:存储滤波器组,完成滤波器组训练过程。

【技术特征摘要】
1.一种滤波器组训练方法,其特征在于,具体包括以下步骤: 步骤1:预处理模块将已有目标位置标注的训练图像进行预处理,得到减少光照和阴影影响的去噪训练图像集; 步骤2:聚类模块对去噪训练图像集进行初始聚类,使去噪训练图像集按外观分解成K个训练集合; 步骤3:理想滤波设计模块根据步骤I所述的训练图像中的目标位置标注设计出理想滤波输出模型,且理想滤波输出模型中的目标位置处于峰值,而在除目标位置外的其他位置接近零; 步骤4:应用K个训练集合训练理想滤波输出模型得到对应K个训练集合的K个总滤波器模型和K个图像样本,K个总滤波器模型构成滤波器组,K个图像样本构成图像样本集; 步骤5:判断图像样本集是否收敛,如果是,执行步骤7 ;否则,执行步骤6 ; 步骤6:检查当前判断收敛的次数是否达到预设阈值,如果是,执行步骤7 ;否则,对去噪训练图像进行重新分类,得到K个新训练集合,K个新训练集合替代K个训练集合,返回步骤4 ; 步骤7:存储滤波器组,完成滤波器组训练过程。2.根据权利要求1所述的滤波器组训练方法,其特征在于,步骤I中的预处理包括进行取对数处理、均值归零、能量归一化以及乘余弦窗口操作。3.根据权利要求2所述的滤波器组训练方法,其特征在于,步骤2中的聚类方法采用k-means聚类方法。4.根据权利要求3所述的滤波器组训练方法,其特征在于,所述步骤5中对图像样本集是否收敛的条件是由自定义的同时考虑相关滤波选择及输出的能量损失函数来判定的,当能量损失函数不再变小,则图像样本集收敛,能量损失函数的计算基于以下公式: ε(^)=ΣΣιι^0Τ-^ιι2/^.7-1 ?-1 其中H是滤波器组,Ηω是滤波器组中的第j个滤波器,Fi是第i个训练样本的傅里叶变换,*表示共轭转置,Gi是第i个训练样本的理想滤波输出,r^_是属于第j类的训练图像数目。5.根据权利要求1-4任一项所述的滤波器组训练方法,其特征在于,所述步骤6中对去噪训练图像进行重新分类是根据各个总滤波器模型与理想滤波输出模型的差异决定对应的训练集合归属哪个新训练集合。6.一种图像关键点定位方法,其特征在于,具体包括以下步骤: 步骤1:接收待定位图像,将待定位图像与滤波器组中的所有总滤波器模型进行相关滤波操作,得到K个滤波输出; 步骤2:选择PSR(Peak to sidelobe ratio)峰瓣率最大的滤波输出作为最佳滤波输出; 步骤3:将最佳滤波输出 的峰值位置设置为图像关键点位置,完成图像关键点定位。7.根据权利要求6所述的图像关键点定位方法,其特征在于,所述PSR(Peaktosidelobe ratio)峰瓣率的计算基于以下公式(I): PSR(g) = (gmax- U si) / σ si公式(I)其中g为滤波输出,gmax为滤波输出的最大值,...

【专利技术属性】
技术研发人员:葛仕明杨睿孙利民陈水仙谢凯旋朱红松
申请(专利权)人:中国科学院信息工程研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1