一种小样本情况下多稀疏表示的人脸识别方法,该方法采用两种方式来解决人脸识别中的小样本情况,一是由给定的原始训练样本产生“虚拟样本”,增加训练样本数;二是在产生虚拟样本的基础上,用三种非线性特征抽取方法,即核主成分分析、核鉴别分析和核局部保持投影算法,抽取样本的特征;这样就会得到三类特征模式,对每种特征模式构建稀疏表示模型;对每个样本总共构建三个稀疏表示模型,最后根据表示结果来分类。本发明专利技术提供的多稀疏表示分类方法通过对称镜像产生虚拟人脸,再构建基于L1范数的多稀疏表示模型并分类。本方法与其它分类方法相比,该方法鲁棒性强,分类效果好,特别适用于很多数据维数高且训练样本少的分类场合。
【技术实现步骤摘要】
【专利摘要】,该方法采用两种方式来解决人脸识别中的小样本情况,一是由给定的原始训练样本产生“虚拟样本”,增加训练样本数;二是在产生虚拟样本的基础上,用三种非线性特征抽取方法,即核主成分分析、核鉴别分析和核局部保持投影算法,抽取样本的特征;这样就会得到三类特征模式,对每种特征模式构建稀疏表示模型;对每个样本总共构建三个稀疏表示模型,最后根据表示结果来分类。本专利技术提供的多稀疏表示分类方法通过对称镜像产生虚拟人脸,再构建基于L1范数的多稀疏表示模型并分类。本方法与其它分类方法相比,该方法鲁棒性强,分类效果好,特别适用于很多数据维数高且训练样本少的分类场合。【专利说明】
本专利技术涉及,属模式识别与机器学 习
。
技术介绍
随着计算机、网络和多媒体等技术的发展,人们需要处理的高维复杂数据如图像 和视频等数据日益增多,对这些数据处理大多是分类或识别。近年来,图像识别的一个重要 分支即生物特征识别方兴未艾,是当前模式识别领域的一个研究热点。相对于其他生物特 征识别技术如指纹识别,人脸识别由于其使用方便被广泛关注和使用。例如,911之后,美 国在多个机场采用人脸识别系统,2008年北京奥运会和2012年的伦敦奥运会均使用了人 脸识别系统,这些系统极大地提高了对观众和其他相关人员的身份认证和识别等工作的效 率。 最近一二十年来,涌现了许多人脸识别方法。典型的算法有基于几何特征的方法 和基于统计学习的算法等。基于几何特征的识别方法目的是提取人脸图像的二维特征如形 状和纹理,以及三维模型,它们主要用于匹配来识别人脸。基于统计学习方法主要抽取人脸 图像的统计特征,再用某一分类器对人脸分类。这类方法的经典代表有主成分分析法,线性 鉴别分析方法和基于核的人脸识别方法等。我们知道,现实生活中的很多事物都具有稀疏 性这一普遍特点。在人脸识别领域,最新研究表明,在每一类人脸图像样本较充分的情况 下,这些人脸样本可以张成一个人脸子空间,此类人脸的每一幅图像都能由这个子空间线 性表示或逼近。也就是说,来自这一类的人脸图像可以用此类全体人脸图像的线性组合来 表示,至少可以近似表示。因此,当用训练样本的全体表示一测试样本时,和测试样本同类 的训练样本的表示系数中非零的个数较多,而其他类的训练样本的表示系数大都是零或接 近零,也即表示系数是稀疏的。基于这样的思想,经典的基于稀疏表示的人脸识别方法被提 出,并引起了很多关注。 经典稀疏表示方法对人脸图像带有噪声情况如遮挡等识别效果比较好,即可以达 到鲁棒的人脸识别效果,这也是该方法在人脸识别领域受到广泛关注的主要原因。不过,该 方法取得好的识别效果需要有下面的假设,即对测试样本的表示需充分稀疏。然而,这个假 设在很多应用场合并不满足,特别是在训练样本个数很少,甚至是单幅训练样本图像时,经 典稀疏表示方法的分类效果会不理想。但是,在现实生活中,有很多应用领域获取训练图像 比较困难或代价比较大。比如,安全部门在采集人脸图像时,由于条件受限,一般很难采集 充分多的人脸图像,有时甚至是在人们不知情的情况下采集的,大都只采集一张图像样本。 其中,最典型的代表就是身份证的人脸正面图像,每人一张。在这种情况下,虽然稀疏表示 分类方法仍可以使用。但是,由于训练样本个数很少,用它们表示测试样本将很难得到稀疏 的表示模型。根据稀疏表示理论,如果对测试样本的表示模型越稀疏,则基于此模型的分类 或识别效果会越好。因此,经典稀疏表示分类算法,对训练样本个数很少甚至只有一个(为 简便起见,在此称为"小样本"),将不能很好发挥作用。 -般地,人脸识别时需要把人脸图像拉成一列或一行向量,每个像素点对应向量 的一个分量。由于人脸图像包含有成千上万个像素点,因此,把人脸样本图像拉成向量后, 此样本向量的维数往往都很高。在很多人脸识别方法包括经典的稀疏表示分类算法,都需 要将样本向量的维数降低,这既可以降低算法的时间复杂度,又在某种程度上去除噪声。降 维的过程其实也是特征抽取的过程,根据机器学习和模式识别理论,特征抽取有很多种,其 中近年来比较流行的经典的方法是基于子空间学习的特征抽取,它有线性与非线性两类方 法。第一类线性方法主要有主成分分析,线性鉴别分析和局部保持投影等算法。第二类非 线性方法主要是基于核的子空间特征抽取方法,如核主成分分析、核鉴别分析和基于核的 局部保持投影方法。与线性特征抽取方法相比,非线性特征抽取算法实现起来稍显复杂,但 是它可以抽取数据中的有利于分类的非线性信息。 我们知道,人脸图像数据分布都比较复杂,其类别之间的边界一般是非线性的。也 可以说,人脸样本数据含有很多非线性信息。如果在降维的时候能够获取这些有利于分类 的非线性信息,则能使分类器获得更好的效果。因此,在本专利技术中,采用非线性特征抽取算 法对数据降维,同时,又能获取数据中的非线性信息,从而提高分类效果。 如前所述,小样本情况下的稀疏表示分类算法的识别效果并不理想,其主要原因 就是训练样本或训练样本的特征模式过少导致。解决此问题的办法就是增加训练样本或特 征模式。因为在不少场合,训练样本不容易采集,直接增加样本往往比较困难。但是,一个 训练样本可以看作是由训练样本集抽样得到。这个训练样本集的其他样本和所给的训练样 本有很多相似之处,对所给定的训练样本做一些变换,得到的新的样本仍然可以当作训练 集中的一个元素。这一新样本在此称为"虚拟样本",在训练中,它和实际样本的地位应是相 等的,也可以用来被训练。另一方面,对于一个样本,每使用一个特征抽取方法,就会得到一 个特征模式。 综上所述,稀疏表示分类在人脸识别中是有很大优势的。尽管会遇到小样本情况, 但只要处理得当,比如,增加训练样本或特征模式,将会有效提高经典稀疏表示分类精度, 并能扩展其应用范围。最近,中国专利公开了一种基于核函数与稀疏编码的高清图像分类 方法(【专利技术者】范自柱, 倪明, 康利攀 申请人:华东交通大学本文档来自技高网...
【技术保护点】
一种小样本情况下多稀疏表示的人脸识别方法,其特征在于,所述方法采用两种方式来解决人脸识别中的小样本情况,一是由给定的原始训练样本产生“虚拟样本”,增加训练样本数;二是在产生虚拟样本的基础上,用三种非线性特征抽取方法,即核主成分分析、核鉴别分析和核局部保持投影算法,抽取样本的特征;这样就会得到三类特征模式,对每种特征模式构建稀疏表示模型;对每个样本总共构建三个稀疏表示模型,最后根据表示结果来分类。
【技术特征摘要】
【专利技术属性】
技术研发人员:范自柱,倪明,康利攀,
申请(专利权)人:华东交通大学,
类型:发明
国别省市:江西;36
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。