使用部分学习模型的面部识别的方法技术

技术编号:2932598 阅读:168 留言:0更新日期:2012-04-11 18:40
一种用于对面部图像数据进行分类的系统和方法,该方法包括以下步骤:训练一个分类器设备以便识别一个或多个面部图像和得到该面部图像被用于训练的相应学习模型;把包括代表要被识别的一部分未知面部图像的数据的矢量输入到该分类器;按照分类方法对该部分未知面部图像进行分类;重复进行输入和分类步骤,在每次迭代时使用该未知面部图像的不同部分;以及标识由到该分类器的不同部分输入而引起的单个类别。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及面部识别系统,具体地,涉及一种通过使用部分的学习模型进行面部识别的系统和方法。现有的面部识别系统试图通过将未知的面孔与那个主体的面孔的先前实例进行匹配来识别该未知的面孔。这典型地是通过使用该主体面孔的先前实例来训练分类器,然后使用经过训练的分类器、通过将该主体面孔的先前实例与该主体面孔的新实例进行匹配来识别该主体。众所周知,训练分类器牵涉到学习主体的面孔的模型。现有的系统在分类期间使用整个模型。虽然任何模式识别系统的设计的最终目的是得到最好的可能的分类(预测)性能,但这个目的在传统上导致开发出了对于要被解决的任何模式识别问题的不同分类方案。然后不同设计方案的实验评估结果便作为基础来选择其中一个分类器(模型选择)作为问题的最终解决方案。在这样的设计研究中已经看到,虽然其中一个设计将产生最好的性能,但由不同的分类器误分类的图案组不一定重叠,正如在Kittler,J.,Hatef,H.和Duin,R.P.W.的、题目为“Combining Classifiers(组合分类器)”,Proceedings of the 13thInternational Conference on patternRecognition,Vol.II,第897-901页,奥地利维也纳,1996的参考文献中认识到的。这篇文章提出,不同的分类器设计潜在地提供有关要被分类的图案的互补的信息,这可被利用来改进总的性能。在神经网络应用中通常的做法是训练许多不同的候选网络,然后根据例如独立的验证组的性能来选择最好的网络,以及只保留这个网络,且丢弃其余网络。这样的方法有两个缺点。首先,与训练其余网络有关的所有努力被浪费。第二,验证组的通用化性能由于数据中的噪声而具有随机的成分,所以对于验证组具有最好性能的网络不一定是对新的或未见到的测试数据具有最好性能的网络。这些缺点可以通过把网络组合在一起以形成网络的委员会(committee)而克服。这样的方法的重要性在于,它可导致对新数据的预测的重大改进,而同时只牵涉到很小的附加计算工作。事实上,委员会的性能可以比孤立地使用的最好单个网络的性能更好,正如在C.M.Bishop的、题目为“Neural Network for PatternRecognition(用于模式识别的神经网络)”,Oxford Press,Oxford,UK,第364-377页,1997的参考书中讨论的。为了识别面孔,识别系统采用多个分类器,该每个分类器对个体面孔的轮廓进行训练。根据探测器(测试图像)的呈现,把该探测器与每个学习模型进行匹配,以及从每个分类器得到的分数被使用,直到达到一致的决定。训练多个分类器的明显的缺点是,在训练和存储模型文件时浪费许多时间和空间。因此非常希望提供一种面部识别系统和方法,由此作为对使多个分类器对个体面孔的各个轮廓进行训练的替代,可以使单个分类器对个体面孔的正面面孔或多个轮廓进行训练。还非常希望提供一种面部识别系统和方法,其中一个主体模型的各部分被实施和被使用来相对一个主体面孔的不同部分进行匹配。也就是,在测试期间,通过把学习模型的不同部分与未知的面部图像进行匹配而标识该未知的面部图像。因此,本专利技术的一个目的是提供一种实施分类器(例如RBF网络)的系统和方法,该分类器可被训练来识别一个个体面孔的正面面孔或多个轮廓。本专利技术的另一个目的是提供一种实施单个分类器设备的面部识别系统和方法,该单个分类器设备已经对主体的面孔的正面轮廓进行训练,以及在测试期间,取未知的测试图像并使用不同的部分把它与学习模型进行匹配。优选地,在相对每个部分进行匹配后,确定匹配的概率,然后组合分数,以便达到一个一致的决定。例如,被分类的每个部分将生成一张选票。也就是,如果使用十(10)个部分,则将得到10张选票。然后,使用简单的投票规则(例如,如果10张中的6张是支持“A”,则主体的身份是“A”)来确定该个体的身份。按照本专利技术的原理,提供了一种用于对面部图像数据进行分类的系统和方法,该方法包括以下步骤训练一个分类器设备以便识别一个或多个面部图像和得到该面部图像被用于训练的相应学习模型;把包括代表要被识别的一部分未知面部图像的数据的矢量输入到该分类器中;按照分类方法对该部分未知面部图像进行分类;重复进行输入和分类步骤,在每次迭代时使用该未知面部图像的不同部分;以及识别由输入到该分类器的不同部分所产生的单个类别。有利地,虽然可能使用RBF分类器,但应当看到,也可以使用其他方法,包括各种概率/统计方法的组合。借助于以下列出的附图,在下文中描述这里揭示的本专利技术的细节,其中附图说明图1总的显示传统的三层后向传播网络10的结构,根据该网络,构成按照本专利技术的原理实施的RBF网络;图2显示馈送到网络的一组面部图像的样本。为了描述起见,实施径向基函数(“RBF”)分类器,尽管可能实施任何分类方法/设备。RBF分类器设备是从2001年2月27日提交的、题目为“Classification of objects through model ensembels(通过模型集群的对象分类)”的、共同拥有的、共同待决的美国专利申请序列号No.09/794,443可获得的,该专利申请的整个内容和公开内容在此整体引用,以供参考。现在参照图1描述在共同拥有的、共同待决的美国专利申请序列号No.09/794,443中揭示的RBF网络的结构。如图1所示,基本RBF网络分类器10按照传统的三层后向传播网络10被构建,包括由源节点(例如k个传感单元)组成的第一输入层12;包括i个节点(其功能是聚类数据和减小它的维数)的第二或隐层14;以及包括j个节点(其功能是提供网络10对于加到输入层12的激活模式的响应20)的第三或输出层18。从输入空间到隐单元空间的变换是非线性的,而从隐单元空间到输出空间的变换是线性的。特别地,正如C.M.Bishop,“Neural Networkfor Pattern Recognition(用于模式识别的神经网络)”,ClarendonPress,Oxford,1997的参考书中讨论的(该书的内容和公开内容在此引用,以供参考),可以按照两种方式来看待RBF分类器网络10:1)把RBF分类器解释为一组核心功能,它们把输入矢量扩展为高维空间,以便利用数学论据与低维空间中的分类问题相比,被透射到高维空间的分类问题更可能是线性可分离的;以及2)把RBF分类器解释为函数映射内插方法,该方法试图通过取基函数(BF)的线性组合而构建超曲面(hypersurface),每个类别一个超曲面。这些超曲面可被看作为鉴别函数,其中该超曲面对于它代表的类别具有高的数值,以及对于所有其他类别具有低的数值。未知的输入矢量被分类为属于与在该点具有最大输出的超曲面有关的类别。在这种情形下,BF不用作为用于高维空间的基,而用作为在想要的超曲面的有限扩展中的分量,其中分量系数(权重)必须被训练。进一步参考图1,RBF分类器10,在输入层12和隐层14之间的连接22具有单位权重,且作为结果,它们不必被训练。在隐层14中的节点,即所谓的基函数(BF)节点,具有由特定的均值矢量μi(即,中心参量)和方差矢量σi2(即,宽度参量)规定的高斯脉冲非线性,其中i本文档来自技高网...

【技术保护点】
一种用于对面部图像数据进行分类的方法,该方法包括以下步骤:a)训练一个分类器设备(10),以便识别一个或多个面部图像和得到该面部图像被用于训练的相应学习模型;b)把包括代表要被识别的一部分未知面部图像的数据的矢量输入到所述分 类器(10)中;c)按照分类方法对所述部分的所述未知面部图像进行分类;d)重复进行步骤b)和c),在每次迭代时使用所述未知面部图像的不同部分;以及e)标识(28)由输入到所述分类器的所述不同部分而产生的单个类别。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:SVR古特塔V菲尔洛明M特拉科维
申请(专利权)人:皇家飞利浦电子股份有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1