一种非相邻的图结构稀疏人脸识别方法,该方法包括非相邻的图结构稀疏、分块组合搜索、结构稀疏度的衡量方法和实现结构稀疏重构。所述方法在SRC模型的基础上,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的;为了实现非相邻图结构稀疏,通过组合方法来搜索所有可能的组合,从而获得相邻或非相邻组块;为了避免在搜索中产生组合爆炸,提出分块组合搜索的方法用于限制搜索空间,产生计算上可行的基子集空间;所述方法采用结构贪婪算法来实现非相邻的图结构稀疏重构,算法迭代中,根据基块贡献度大小来选择基块,以编码复杂度来衡量结构稀疏度。本发明专利技术可显著提高人脸识别率。
【技术实现步骤摘要】
一种非相邻的图结构稀疏人脸识别方法
本专利技术涉及一种非相邻的图结构稀疏人脸识别方法,属稀疏表示人脸识别
技术介绍
压缩感知(Compressedsensing,CS)针对具有稀疏性或在特定域上具有稀疏性的信号,通过实施远低于奈奎斯特采样率的随机采样,利用信号的稀疏性和测量矩阵与测量基之间的非相干性,可高概率地精确重构原始信号。在压缩感知理论的推动下,近几年,稀疏编码和稀疏表示技术得到了飞速发展。稀疏表示的思想是假设观测数据y∈Rn可表示成数据字典D∈Rn×p的稀疏线性组合,即:y=Dα,式中α∈Rp是y在字典D下的表示系数。基于稀疏表示的人脸识别方法是在已知y和D的条件下,通过压缩感知重构算法求解稀疏表示系数α,再通过分析稀疏表示系数对样本进行判别归类。稀疏表示的人脸识别技术可以分为传统的稀疏表示人脸识别、非重叠的组结构稀疏人脸识别和可重叠的图结构稀疏人脸识别三个阶段。传统的稀疏表示分类模型(SparseRepresentation-basedClassification,SRC)是将一个人脸识别问题转变为一个稀疏表示问题,即将测试数据表示成数据字典的稀疏线性组合,如图1所示。SRC的数据字典是由已知分类的所有类别的训练样本构成,若训练样本有m个类别,每类别有q个训练数据,每个图像被堆叠为一维向量,则数据字典可表示为D=[d11...d1q,......,di1...diq,......,dm1...dmq],式中[di1,...diq]是第i类的训练样本。如果y是第i类的测试数据,则在理想的情况下,通过稀疏重构所获得的表示系数中,字典原子[di1,...diq]所对应的系数项为非零,而其他项为零,即表示系数可表示为:它是稀疏的,平均只有1/m个非零项,测试数据可表示为y=[di1,...,diq][αi1,...,αiq]T。但由于人脸图像都具有类似的特征,使得其他类别所对应的表示系数并不一定为零,因而存在着挑战的问题。在SRC的基础上,有关文献提出了鲁棒的SRC模型(R-SRC),将噪声的影响考虑进来,则测试数据y=y0+e,y0可表示为训练字典D的稀疏线性组合,噪声e∈Rn可表示为单位矩阵Λ∈Rn×n的稀疏线性组合,将训练字典和单位矩阵合并可构成新的过完备字典基[DΛ],y可表示为新基下的稀疏线性组合,R-SRC模型对噪声和伪装具有很强的鲁棒性。有文献综合了此类稀疏分类模型,将各种保真函数与惩罚函数相结合,得到适合不同条件的人脸识别模型,统称为竞争表示模型(collaborativerepresentationbasedclassification,CRC)。有的文献提出了扩展的SRC模型(ESRC),ESRC模型假设各类别共享相同的环境条件,其字典不仅包含训练样本,还包括各类别的类内差异,ESRC模型可以应用于单个训练样本的场合。传统的SRC模型将每个字典原子分隔开来,独立处理,没有考虑各原子之间的关系,所产生的稀疏是非结构的。近年来,研究人员根据SRC模型中数据字典的组块结构,提出了组结构的稀疏表示分类模型(GroupSparseRepresentation-basedClassification,GSRC),此模型利用了数据字典的组块特性,限制了搜索空间,从而提高了人脸识别的性能。但人们也发现如果组块内的成员能互相补充,互相促进,则能增强数据的表示能力;但如果组块内成员的作用互相抵消,则组结构会起到相反的作用。为此人们采用聚类方法或非线性流行学习的方法,将相似的样本进行聚类,然后根据聚类结果将类内样本进一步划分为多个小组,此方法一定程序上可以降低组块划分不当造成的影响。但并不是相似样本构成的组块其表示能力就能增强,组块内成员相似,意味着其产生的作用重复,因此相似样本所起到的作用较小;反而是一些差异较大的样本,由于他们互相补充,其数据表示能力增强较大。另外,如果组块内成员差异较大,也有可能其成员的作用互相抵消,则会降低组块的作用。因此对数据字典进行聚类处理,其作用有限。图结构是比组结构更一般的数据结构,其组划分是动态的、可重叠的,其组划分预先是不可知的。为了寻找到最佳的组划分,需要通过搜索的方式分析所有可能的组合,这种搜索如果不加限制,则很可能产生组合爆炸,为此一般的图稀疏方法都是限制组成员由相邻元素构成,其组划分的方法就好像是用一个滑动窗口在数据上截取组块,所截取的组块,其成员是由相邻元素构成。一般图结构稀疏方法比较适合自然数据,因为自然数据都具有一定的连续性,由相邻元素构成的组块可以表示具有连续特性的自然数据。然而SRC模型其数据字典并没有这样的连续性,因而一般的图结构稀疏也不适合SRC模型。
技术实现思路
本专利技术需要解决的问题包括:如何表示非相邻的图结构?如何搜索表示能力最强的组块?为了避免搜索过程中的组合爆炸,采取什么样的限制策略?使算法既具有可行性,又能寻找到所需要的组块。在算法实现过程中,如何衡量结构稀疏度?并进行量化实现。最后选择哪种压缩感知重构算法?本专利技术的技术方案是,本专利技术一种非相邻的图结构稀疏人脸识别方法包括非相邻的图结构稀疏、分块组合搜索方法、结构稀疏度的衡量方法及实现结构稀疏重构的算法。本专利技术方法根据稀疏表示分类模型数据字典的结构特点,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的;为了实现非相邻图结构稀疏,所述方法采用组合搜索的方法获得所有可能的组块,包括相邻或不相邻的组块,从中寻找表示能力最强的组块;为了避免在搜索中产生组合爆炸,所述方法提出分块组合搜索的方法用于限制搜索空间;此外,所述方法还提出以编码复杂度来衡量结构稀疏度,采用结构贪婪算法来实现结构稀疏重构。本专利技术是在SRC模型的基础上,利用数据字典中的结构先验知识,通过非相邻的图结构稀疏来提高人脸识别的性能。现有的结构稀疏方案,无论是非重叠的组稀疏,还是可重叠的图稀疏,其组成员都要求是相邻的,这种限制能缩小搜索范围,比较适合具有连续性的自然数据的处理。非相邻的图结构,其与一般的图结构的最大区别在于其组成员可以是不相邻的;一般的图结构稀疏方法为了缩小搜索范围,都要求组块成员是相邻的,这种限制符合一般自然数据的特征,因为自然数据都具有连续性,其组块由相邻元素构成,因此这种限制并不会丢失所需要的组块。但SRC数据字典的排列没有连续的特性,系统所需要的组块很可能是不相邻的,因此这种相邻的组结构或图结构并不适合SRC模型的结构特征。为此本专利技术提出非相邻的图结构,其组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的。为了实现非相邻的图结构稀疏,需要搜索所有可能的组块,包括相邻或非相邻,为此,本专利技术设计使用组合搜索的方式来搜索所有可能组合。显而易见,如果不加限制,这种组合搜索很容易产生组合爆炸,造成不可行计算。为了避免搜索过程中的组合爆炸,设计了相应限制策略以缩小搜索范围;首先可以仅搜索固定长度的小组块,把这些小组块作为基块,由基块的联合构成其他形式的组块;若b是基块的索引,B是所有基块的索引集合,称为基子集,则任何一个组块的索引F都能表示为基子集的并集,F=∪b∈Bb。因此仅需要搜索基子集空间,就能搜索到所有需要的组块。但是通过以本文档来自技高网...
【技术保护点】
一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述方法包括非相邻的图结构稀疏、分块组合搜索方法、结构稀疏度的衡量方法及实现结构稀疏重构的算法;所述方法根据稀疏表示分类模型数据字典的结构特点,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员可以是不相邻的;为了实现非相邻图结构稀疏,所述方法采用组合搜索的方法获得所有可能的组块,包括相邻或不相邻的组块,从中寻找表示能力最强的组块;为了避免在搜索中产生组合爆炸,所述方法提出分块组合搜索的方法用于限制搜索空间;此外,所述方法还提出以编码复杂度来衡量结构稀疏度,采用结构贪婪算法来实现结构稀疏重构。
【技术特征摘要】
1.一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述方法包括非相邻的图结构稀疏、分块组合搜索方法、结构稀疏度的衡量方法及实现结构稀疏重构的算法;所述方法根据稀疏表示分类模型数据字典的结构特点,通过非相邻的图结构稀疏来增强系统的性能,非相邻图结构的组块是动态的,可重叠的,预先不可知的,组成员包括不相邻的;为了实现非相邻图结构稀疏,所述方法采用组合搜索的方法获得所有可能的组块,包括相邻或不相邻的组块,从中寻找表示能力最强的组块;为了避免在搜索中产生组合爆炸,所述方法提出分块组合搜索的方法用于限制搜索空间;此外,所述方法还提出以编码复杂度来衡量结构稀疏度,采用结构贪婪算法来实现结构稀疏重构;所述分块组合搜索方法是采用组合方法来搜索所有可能的组块,为了避免搜索过程中的组合爆炸,设计了相应限制策略以缩小搜索范围;首先仅搜索固定长度的小组块,把这些小组块作为基块,由基块的联合构成基子集空间的组块;若b是基块的索引,B是所有基块的索引集合,称为基子集,则任何一个组块的索引F都能表示为基子集的并集,F=∪b∈Bb;因此仅需要搜索基子集空间,就能搜索到所有需要的组块;所述分块组合搜索方法将数据字典按类别自然分块,再在数据块内进行组合搜索,最后将各数据块的搜索结果合并;这种分块组合搜索所产生的空间是较小的,设表示系数的维数是300,共60个类别,每类别5个样本,则相应的基子集空间的大小为远小于不分块的组合搜索产生的搜索空间;通过所述方法可以极大地缩减搜索空间,将一个NP的组合搜索问题变为一个可行计算。2.根据权利要求1所述的一种非相邻的图结构稀疏人脸识别方法,其特征在于,所述非相邻的图结构,其与一般的图结构的最大区别在于其组成员包括不相邻的;一般的图结构稀疏方法为了缩小搜索范围,都要求组块成员是相邻的,这种限制符合一般自然数据的特征,因为自然数据都具有连续性,其组块由相邻元素构成,因此这种限制并不会丢失所需要的组块;...
【专利技术属性】
技术研发人员:蔡体健,谢昕,曾德平,
申请(专利权)人:华东交通大学,
类型:发明
国别省市:江西;36
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。