本发明专利技术属于图像处理与模式识别技术领域,适用于驾驶员疲劳检测。首先建立人脸图像库和用户人脸图像库,计算每幅图像的人眼图像,并按不同比例将两数据库进行混合;再计算混合人眼图像库中每幅图像的haar-like特征向量,并采用AdaBoost方法构建强分类器;再随机选取若干幅用户人脸图像库中的人眼图像,对构建的强分类器进行判断,选取识别准确率最高的强分类器作为用户驾驶过程中使用的人眼状态识别分类器。本发明专利技术根据用户定制的思想,采用用户数据与人脸库数据混合的方法,对不同用户使用不同的分类器,使得分类器既能提高识别准确率,又降低了识别风险;本发明专利技术还提供了戴眼镜与不戴眼镜两种不同分类器,使得人眼状态识别更具灵活性。
【技术实现步骤摘要】
本专利技术属于图像处理与模式识别
,涉及驾驶员疲劳检测技术。
技术介绍
目前,交通事故每年导致数以万计的车辆碰撞和重大的人员伤亡,据不完全统 计,全世界因道路交通事故导致死亡的人数超过60万,其中由于驾驶员疲劳驾驶造成 的交通事故至少有10万起,直接经济损失达125亿美元。驾驶员疲劳驾驶已和酒后驾 驶一样,成为交通事故的主要隐患。伴随计算机技术的发展,各国研究人员已经从各 个领域开始深入研究疲劳驾驶的检测方法,1998年美国联邦高速公路管理局试验证实 了 PERCL0S(单位时间人眼闭合的百分比)与驾驶员的疲劳状况具有高度的相关性, 这为疲劳驾驶检测开辟了新的思路。详见文献D.F.Dinges,and R. Grace, "PERCLOS A valid psychophysiological measure of alertness asassessed by psychomotor vigilance,,,US Department of Transportation, Federal highwayAdministration. Publication Number FHWA-MCRT-98-006。基于PERCLOS特征的疲劳驾驶检测方法通常采集驾驶员正面,尤其是眼睛区域的 视频图像进行处理,整个检测方法主要包括人脸定位、人眼定位、人眼状态识别三个过程。 而这些过程都可归结为模式识别中对人脸与非人脸、人眼与非人眼、睁眼与闭眼的分类问 题。解决上述分类问题通常有以下几种经典方法(1)SVM,即支持向量机。SVM是一种基于 结构风险最小化的统计学习理论的学习机,被广泛应用于模式识别各个分支。SVM最早由 Vapnik等提出,它特别适用于高维小样本问题,有很好的推广能力。(2)FLD,即Fisher线 性鉴别。FLD试图寻求一个投影方向,使得对2类样本鉴别最好。求得最佳投影方向Z后, 将所有的样本投影到最佳投影方向,得到1 = w*Tx,并且选择一个阈值来进行2类划分。基于Haar型矩形特征的Adaboost算法。Adaboost算法是一种近年来被广泛应用的学 习算法,它最早由Schapire等人提出,其主要思想是从一个大的弱分类器空间中选出部分 弱分类器,并将它们组合起来构成一个强分类器。实验表明,基于Haar型矩形特征的Adaboost算法鲁棒性强、正确率高而且速 度快,具有非常明显的实际应用价值。其具体做法是从正负样本中提取Haar-Iike特征 向量,然后使用级联AdaBoost方法构建分类器模型,训练出分类器的具体参数。详见 文献 Paul Viola andMichael J. Jones. “Rapid Object Detection using a Boosted Cascade of Simple Features,,,IEEECVPR, 2001.和 文献 R. Lienhart, Α. Kuranov, and V.Pisarevsky. “Empirical analysis of detectioncascades of boosted classifiers for rapid object detection,,,In DAGM25th Pattern RecognitionSymposium,2003。在实际应用中,采用基于Haar型矩形特征的Adaboost算法,通过一般的人脸样本 库训练出来的分类器参数可以运用于人脸定位与人眼定位;而对于眼睛状态的识别,该方 法对于大部分人群只能达到一定的准确率,而对于另一部分人群误识率相对较高,甚至完 全错误。这是由于每个人的眼睛睁开与闭合的差异性很大,以及是否配戴眼镜等习惯,很难用一个通用的分类器进行判别。
技术实现思路
本专利技术提供,该方法可以根据不同 的用户生成不同的眼睛状态的分类器,提高眼睛状态识别的准确率与适用范围。为了方便地描述本
技术实现思路
,首先对一些术语进行定义。定义1 眼睛状态。对于疲劳驾驶检测来说,眼睛状态分为睁开与闭合两种类型。定义2 人脸样本库。本专利技术中的人脸样本库是指包含了不同正面人脸的图像库。 该数据库的图像应在不同的光照环境下采集,并且根据是否配戴眼镜,划分为佩戴眼镜数 据库和未佩戴眼镜数据库。定义3 人眼中心点。对于睁眼图像,定义人眼中心点为瞳孔中心位置;对于闭眼 图像,定义人眼中心点为眼缝中点位置。定义4 三庭五眼。“三庭五眼”是人的脸长与脸宽的比例,在本专利技术中认为人眼区 域宽度为人脸宽度的十分之三,并且两人眼之间的距离恰好为一个人眼的宽度。定义5 =Haar-Iike特征向量。Haar-Iike特征最早是由Papageorgiou等人用于 人脸表征。Papageorgiou等人在针对正面人脸和人体检测问题的研究中使用Haar小波基 函数,他们发现标准正交Haar小波基在应用上受到一定的限制,为了取得更好的空间分辨 率,他们使用了 3种形式的特征。Viola等人在此基础上作了扩展,使用2种类型共4种形 式的特征。到后来Lienhart又增加了几种斜边的矩形特征,使得特征类型达到3种类型14 种形式(如图2所示)。定义6 :AdaBoost。Adaboost全称是Adaptive Boost,是一种迭代算法,其核心思 想是针对同一个训练样本集训练不同的分类器(弱分类器),然后把这些弱分类器组合起 来,构成一个强分类器。其算法本身是通过改变数据分布来实现的,它根据每次训练样本集 之中每个训练样本的分类是否正确,以及上次总体分类的准确率,来确定每个训练样本的 权值。将修改过权值的新训练样本集送给下层分类器进行训练,最后将每次训练得到的分 类器组合起来作为决策分类器(强分类器)。使用Adaboost分类器可以排除一些不必要的 训练样本特征,并将分类的主要依据放在主要的训练样本特征上面。其中常见的Adaboost 有 Discrete AdaBoost、Real AdaBoost 禾口 Gentle AdaBoost。Discrete AdaBoost 是才旨—— 种弱分类器的输出值限定在{-1,+1}的并经权值调整生成强分类器的AdaBoost算法;Real AdaBoost是指一种弱分类器输出范围为R的并经权值调整生成强分类器的AdaBoost算法; Gentle AdaBoost是一种针对前面两种AdaBoost由于对“不像”的正样本权值调整很高而 导致了分类器的效率下降的问题,而产生的变种算法。本专利技术技术方案如下,如图1所示,包括以下步骤步骤1 建立人脸图像数据库A。所述人脸数据库A包括两个子库Al和A2,其中 一个子库Al由除用户外的、不同个体的、不戴眼镜的、正面人脸灰度图像组成,另一个子库 A2由除用户外的、不同个体的、配戴眼镜的、正面人脸灰度图像组成。人脸数据库A中的人 脸灰度图像的两眼中心点距离不小于48个像素单位,睁眼状态和闭眼状态的人脸灰度图 像数量基本一致。步骤2 建立用户人脸图像数据库B。所述用户人脸图像数据库B包括两个子库Bl 和B2,其中一个子库Bl由用户的、不戴眼镜的、正面人脸灰度图像组成,另一个子库B2由用 户的、配戴眼镜的、正面人脸灰度图像组成。人脸数据库本文档来自技高网...
【技术保护点】
一种基于用户定制分类器的眼睛状态识别方法,包括以下步骤:步骤1:建立人脸图像数据库A;所述人脸数据库A包括两个子库A1和A2,其中一个子库A1由除用户外的、不同个体的、不戴眼镜的、正面人脸灰度图像组成,另一个子库A2由除用户外的、不同个体的、配戴眼镜的、正面人脸灰度图像组成;人脸数据库A中的人脸灰度图像的两眼中心点距离不小于48个像素单位,睁眼状态和闭眼状态的人脸灰度图像数量基本一致;步骤2:建立用户人脸图像数据库B;所述用户人脸图像数据库B包括两个子库B1和B2,其中一个子表示haar-like特征向量x↓[i]所对应的人眼图像睁眼或闭眼的状态;M为人眼图像库C↓[i]↑[1]和C↓[i]↑[2]中人眼图像数量;步骤6:对步骤5所得的2N个训练序列Z↓[i]↑[1]和Z↓[i]↑[2],采用AdaBoost方法构建对应2N个强分类器F↓[i]↑[1]和F↓[i]↑[2];步骤7:从步骤3所建立的用户人眼图像子库B1′中随机选取1000幅以上的人眼图像,计算其haar-like特征向量x,分别采用步骤6所构建的强分类器F↓[i]↑[1]进行判断,得到判断结果:1-睁眼,0-闭眼;同样从步骤3所建立的用户人眼图像子库B2′中随机选取1000幅以上的人眼图像,计算其haar-like特征向量x,分别采用步骤6所构建的强分类器F↓[i]↑[2]进行判断,得到判断结果:1-睁眼,0-闭眼;步骤8:将步骤7所得的判断结果与所选取的人眼图像的实际睁眼或闭眼状态进行比较,进而分别统计出两组强分类器F↓[i]↑[1]和F↓[i]↑[2]的识别准确率,然后选取强分类器F↓[i]↑[1]中识别准确率最高的强分类器作为用户在未佩戴眼镜进行驾驶过程中的人眼状态识别的分类器,选取强分类器F↓[i]↑[2]中识别准确率最高的强分类器作为用户在佩戴眼镜进行驾驶过程中的人眼状态识别的分类器;步骤9:在用户驾驶过程中,实时采集用户的正面脸部图像,并实时计算出24×24像素大小的眼部图像以及该眼部图像的haar-like特征向量x,最后根据用户是否佩戴眼镜选择步骤8中相应的强分类器进行人眼状态识别。库B1由用户的、不戴眼镜的、正面人脸灰度图像组成,另一个子库B2由用户的、配戴眼镜的、正面人脸灰度图像组成;人脸数据库B中的人脸灰度图像的两眼中心点距离不小于48个像素单位,睁眼状态和闭眼状态的人脸灰度图像数量基本一致;步骤3:计算人脸图像数据库A和用...
【技术特征摘要】
【专利技术属性】
技术研发人员:马争,解梅,孙睿,
申请(专利权)人:电子科技大学,
类型:发明
国别省市:90[中国|成都]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。