一种基于平衡型Vector Boosting算法的人眼状态检测方法技术

技术编号:10184570 阅读:146 留言:0更新日期:2014-07-03 15:05
本发明专利技术公开了一种基于平衡型Vector Boosting算法的人眼状态检测方法,属于人机交互及智能识别技术领域。该方法包括以下步骤:特征提取阶段:采用基于眼睛结构的通用型哈尔特征的计算方法,并将其与改进型稀疏粒度特征算法相结合形成弱特征池,对眼睛进行表征;负样本构建阶段:采用Bag of words词袋技术实现负样本集合的更新,增强负样本集的区分能力;训练阶段:采用平衡型Vector Boosting算法进行分类器训练;检测阶段:利用基于矢量树模型和并行瀑布型模型的结合结构对人眼状态进行检测。本方法将人眼分为睁眼、闭眼和眯眼三种状态,使得检测率更高,误检率更低,实验结果表明,该检测系统的检测率可以达到90%以上,检测时间也仅为0.03s。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种基于平衡型Vector?Boosting算法的人眼状态检测方法,属于人机交互及智能识别
。该方法包括以下步骤:特征提取阶段:采用基于眼睛结构的通用型哈尔特征的计算方法,并将其与改进型稀疏粒度特征算法相结合形成弱特征池,对眼睛进行表征;负样本构建阶段:采用Bag?of?words词袋技术实现负样本集合的更新,增强负样本集的区分能力;训练阶段:采用平衡型Vector?Boosting算法进行分类器训练;检测阶段:利用基于矢量树模型和并行瀑布型模型的结合结构对人眼状态进行检测。本方法将人眼分为睁眼、闭眼和眯眼三种状态,使得检测率更高,误检率更低,实验结果表明,该检测系统的检测率可以达到90%以上,检测时间也仅为0.03s。【专利说明】—种基于平衡型Vector Boosting算法的人眼状态检测方法
本专利技术属于人机交互及智能识别
,涉及一种基于平衡型VectorBoosting算法的人眼状态检测方法。
技术介绍
众所周知,人眼是人脸表情中最重要的一部分,俗语说“眼睛是心灵的窗户”,由此可见,眼睛对于反映心理的人脸表情的重要性和决定性。人机交互模式已从传统的通过鼠标点击或键盘输入,然后通过显示器输出的形式发展到更加自然和谐、接近人与人交流的阶段。此时,赋予计算机一定的“情绪智商”便成为一个重要而急迫的课题。为了达到这个目的,非语言信息(包括语音、步态、手势、表情)的研究已经成为了国内外的热点方向,并且取得了一定的成果。目前的眼睛状态检测算法主要分为两个类别:基于眼球/瞳孔为圆形这一特征进行检测和基于眼部整体结构特征进行检测。前者主要利用眼球/瞳孔的圆形特征,利用Hough变换进行圆形检测来检测眼球的存在,若有则判断为睁眼,否则判断为闭眼;而后者主要根据不同的眼睛状态有着不同的整体结构特征来进行,常用的方法有神经网络算法等。上述方法的不足之处在于只能进行两种眼睛状态的检测,即睁眼和闭眼。而实际上,眯眼也是一种重要的眼睛状态,它处于睁眼和闭眼之间,这样更为细致的模式划分可以大大提闻判断精度。Vector Boosting算法是一种重要的多姿态物体检测方法。在实际应用中,由于各个姿态的物体难以收集到很全的样本,因此其追求的是整体效果最优的特点,难以保证每个姿态都取得较好的检测效果。此外现有的Adaboost技术在负样本收集过程中,存在所收集的某些负样本之间存在较大的相似性问题,因此所训练得到的某一级强分类器可能存在泛化性不大的缺点。
技术实现思路
有鉴于此,本专利技术的目的在于提供,该方法针对现有检测方法的不足,采用平衡型Vector Boosting算法进行人眼状态检测,使得人眼状态的划分模式更为细致,检测率更高,误检率更低。为达到上述目的,本专利技术提供如下技术方案:,包括以下步骤:1)特征提取阶段:采用基于眼睛结构的通用型哈尔(Haar)特征的计算方法,并将其与改进型稀疏粒度特征算法相结合形成弱特征池,对眼睛进行表征;2)负样本构建阶段:采用Bag ofwords词袋技术实现负样本集合的更新,增强负样本集的区分能力;3)训练阶段:采用平衡型Vector Boosting算法进行分类器训练;4)检测阶段:利用基于矢量树模型和并行瀑布型模型的结合结构对人眼状态进行检测。进一步,在特征提取阶段,采用基于眼睛结构的通用型哈尔(Haar)特征的计算方法具体为:令【权利要求】1.,其特征在于:包括以下步骤:1)特征提取阶段:采用基于眼睛结构的通用型哈尔特征的计算方法,并将其与改进型稀疏粒度特征算法相结合形成弱特征池,对眼睛进行表征;2)负样本构建阶段:采用Bagofwords词袋技术实现负样本集合的更新,增强负样本集的区分能力;3)训练阶段:采用平衡型Vector Boosting算法进行分类器训练;4)检测阶段:利用基于矢量树模型和并行瀑布型模型的结合结构对人眼状态进行检测。2.根据权利要求1所述的基于平衡型VectorBoosting算法的人眼状态检测方法,其特征在于:采用基于眼睛结构的通用型哈尔特征的计算方法具体为:令 3.根据权利要求2所述的基于平衡型VectorBoosting算法的人眼状态检测方法,其特征在于:所述改进型稀疏粒度特征算法为:在传统的稀疏力度的计算过程中,将平滑窗口的边长改为2*q。4.根据权利要求3所述的基于平衡型VectorBoosting算法的人眼状态检测方法,其特征在于:采用通用型哈尔特征和改进型稀疏粒度特征相结合形成弱特征池对眼睛进行表征的过程中,还包括利用特征对应的损失函数进行特征选择以降低维数的步骤,具体过程为:将特征对应的损失函数进行排序,挑选分类能力前70%的特征作为预挑选的特征进行训练。5.根据权利要求1所述的基于平衡型VectorBoosting算法的人眼状态检测方法,其特征在于:采用Bag of words词袋技术实现负样本集合的更新的基本步骤为:在大量收集负样本的情况下,利用区域像素距离表征样本之间的差异性,利用聚类技术得到词袋,然后将得到的若干个词袋中心作为新的负样本集合进行分类器训练。6.根据权利要求5所述的基于平衡型VectorBoosting算法的人眼状态检测方法,其特征在于:在利用区域像素距离表征负样本之间的差异性的过程中,区域像素距离的具体计算方法为:将一个负样本平均划分为16个区域,每个区域包含6*6个像素,计算每个区域的像素值之和,并将每个区域的像素和串联成一条16维的矢量实现该负样本的表征。7.根据权利要求1所述的基于平衡型VectorBoosting算法的人眼状态检测方法,其特征在于:在训练阶段,所述平衡型Vector Boosting算法具体为:在当前轮次Boosting过程中利用上一次训练得到的强分类器检测的误识率fri对当前轮次Zi进行加权,使最优化损失函数着重关注上一轮误识率较高的那个分支,从而影响弱分类器的挑选过程,实现平衡各分支收敛速度的目的,这里的损失函数为: 8.根据权利要求1所述的基于平衡型Vector Boosting算法的人眼状态检测方法,其特征在于:在检测阶段,利用基于矢量树模型和并行瀑布型模型的结合结构对人眼状态进行检测,具体包括:采用矢量树模型的Vector Boosting人眼状态检测器根据输出决策矢量G(X)的值 将G(X)为I对应分支的图像继续送入采用并行瀑布型结构的对应分支层叠分类器中检测。【文档编号】G06K9/46GK103902975SQ201410121275【公开日】2014年7月2日 申请日期:2014年3月28日 优先权日:2014年3月28日 【专利技术者】王先梅, 张星, 李程, 解仑 申请人:北京科技大学本文档来自技高网
...

【技术保护点】
一种基于平衡型Vector Boosting算法的人眼状态检测方法,其特征在于:包括以下步骤:1)特征提取阶段:采用基于眼睛结构的通用型哈尔特征的计算方法,并将其与改进型稀疏粒度特征算法相结合形成弱特征池,对眼睛进行表征;2)负样本构建阶段:采用Bagofwords词袋技术实现负样本集合的更新,增强负样本集的区分能力;3)训练阶段:采用平衡型Vector Boosting算法进行分类器训练;4)检测阶段:利用基于矢量树模型和并行瀑布型模型的结合结构对人眼状态进行检测。

【技术特征摘要】

【专利技术属性】
技术研发人员:王先梅张星李程解仑
申请(专利权)人:北京科技大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1