基于多特征混合字典和概率预测的人脸识别方法技术

技术编号:34456403 阅读:29 留言:0更新日期:2022-08-06 17:03
基于多特征混合字典和概率预测机制的人脸识别方法,包括:步骤1、使用高清摄像头,在正常光照情况下对人脸图像进行采集,保证人脸处于图像的中央位置;步骤2、对采样数据提取局部纹理特征和全局特征,将两者结合构建混合过完备字典;步骤3、为满足过完备字典N

【技术实现步骤摘要】
基于多特征混合字典和概率预测的人脸识别方法


[0001]本申请设计人工智能图像处理
,更具体涉及计算机视觉领域中的目标识别以及机器学习中的稀疏度表示方法。

技术介绍

[0002]人脸识别技术是人体生物特征识别技术的一种,是人的内在属性,具有很强的自身稳定性和个体差异性,因此是身份验证的理想依据。人脸特征识别系统对生物特征进行提取并组成特征模板,当人们应用该识别系统进行身份认证时,识别系统提取其特征并与数据库中的特征模板进行比对,以确定是否匹配,从而决定接受或拒绝该人。
[0003]人脸识别是将静态图像或视频图像中检测出的人脸图像与数据库中的人脸图像进行对比,从中找出与之匹配的人脸的过程,以达到身份识别与鉴定的目的, 它是同属于生物特征识别领域和人工智能领域的一个课题。人脸识别是图像分析与理解的一种最成功的应用,因对人脸识别可行性技术的三十多年研究,以及在商业、安全、身份认证、法律执行等众多方面的广泛应用,使其越来越得到重视, 今天,人脸检测的应用背景已经远远超过人脸识别系统的范畴,在基于内容的检索、数字视频处理、视觉检测等方向有着重要的应用。
[0004]研究人脸识别在理论和技术上都有重要意义:一是可以推进对人类视觉系统本身的认识;二是可以满足人工智能应用的需要。采用人脸识别技术,建立自动人脸识别系统,用计算机实现对人脸图像的自动识别有着广阔的应用领域和诱人的应用前景。同时人脸识别作为一种生物特征识别技术与其它识别识别方式(如指纹、虹膜等)相比有着以下三个优点。1.无侵犯性,人脸图像的获取不需要被检测人发生身体接触,这在疫情防控背景下尤为重要;2.低成本、易安装,人脸识别系统只需要采用普通的摄像头即可,对用户来说没有特别的安装要求;3. 无人工参与,整个人脸识别过程不需要用户主动参与,这在安防领域具有重大研究价值。

技术实现思路

[0005]本专利技术克服现有人脸识别技术的不足之处,例如仅采用局部特征忽略了全局颜色特征等问题,提出了基于多特征混合字典和概率预测的人脸识别方法。
[0006]本专利技术一种基于全局色彩特征和局部特征的人脸识别方法,其具体步骤如下:
[0007]步骤1、将拍摄的图像转化为灰度图,并归一化。
[0008]步骤2、将原灰度图划分为四个部分,对每一块进行单独的奇异值分解,得到每一块图像的奇异值特征向量,再将所有局部图像的奇异值特征向量与整体图像的奇异值特征向量组合起来得到一个局部与整体相结合的奇异值特征向量。组合的方法为:对各个局部图像的奇异值特征向量按照从上到下、从左到右的顺序排列,然后将整体图像的奇异值特征向量添加到排列好的向量的末尾,即得到局部与整体结合的特征向量。
[0009]步骤3、对原灰度图利用Gabor滤波器组对输入图像进行卷积处理,将滤波结果图
像划分为均等不重叠的图像子块,并对每个图像子块取灰度平均值,把所有图像子块的灰度平均值串联起来即形成表示图像的特征向量。
[0010]步骤3、将基于奇异值分解的特征图和Gist特征融合,构建混合特征列向量。考虑到当构建原子的特征维度增加时,会导致原子的个数不满足远大于原子维度的约束条件,所以在这里对构建的混合特征进行PCA压缩操作。
[0011]步骤4、将数据集按步骤3将所有图片转化为混合特征列向量后,将数据集按7:2:1的比例划分为训练集、验证集和测试集。将训练集的图像产生的混合特征向量构建混合特征字典D。
[0012]步骤5、稀疏表示研究的是如何用一种简洁的方式将信号进行重构。例如,对于一个信号Y∈R
m*1
,如何用X∈R
n
,Y=DX进行表示。这个问题可以通过求解L0范数最小来解决,即
[0013](L0):Y0=argmin||X||0s.t.Y=DX
ꢀꢀꢀꢀꢀꢀ
(1)
[0014]其中Y为代表是的样本,D为构建的混合字典,X为Y用D表示的系数向量。但是,求解L0范数最小的问题是一个NP难问题。该范数最小值问题可以由迭代贪婪追踪算法来近似求得。稀疏表示和压缩感知最新的理论研究表明,如果寻找到的解X0是足够稀疏的,则求L0范数最小值问题的解可以转化为求下面的L1范数最小值问题的解:
[0015](L1):Y0=argmin||Y||1s.t.Y=DX
ꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0016]步骤6、从混合字典矩阵D中,计算信号y与字典矩阵中每列(原子)的内积,选择绝对值最大的一个原子,它就是与信号y在本次迭代运算中最匹配的,见公式(3)。
[0017][0018]这样,信号y就被分解为在最匹配原子的垂直投影分量和残值两部分,即:
[0019][0020]为避免如果信号(残值)在已选择的原子进行垂直投影是非正交性的,使得每次迭代的结果并不少最优的而是次最优的,收敛需要很多次迭代,需要将残值正则化使其满足,残值与前面每个分量正交。在分解的每一步对所选择的全部原子进行正交化处理,这使得在精度要求相同的情况下,能够增加算法的收敛速度。
[0021][0022]这样选择一个与信号y最匹配的原子(也就是某列),构建一个稀疏逼近,并求出信号残差,然后继续选择与信号残差最匹配的原子,反复迭代,信号y 可以由这些原子来线性和,再加上最后的残差值来表示。如果残差值在可以忽略的范围内,则信号y就是这些原子的线性组合。
[0023]步骤7、根据公式(6)计算残差,其中δ
i
(x
^
)∈R
n
为非零项是x^中与类别 i相关的项的向量。
[0024]min r
i
(y)=||y


i
(x^)||2(i=1,2,...,k)
ꢀꢀꢀꢀꢀꢀ
(6)
[0025]步骤8、通过分析实验结果,正确分类的样本往往具有能量集中的特点,且所在类别的误差值与其他类别的误差值相比有着明显的谷值;而错误分类的样本存在分布不集中、误差值的方差较小的特点。这是因为权重被分布在不同类别的原子上,无明显高峰。为进一步提升识别准确率在分类阶段额外加上概率预测模块,通过对权重对应的原子所在类别,计算权重向量的关联分数。通过SoftMax 函数,将关联分数转化为预测概率,将误差和
预测概率相结合的方式作为分类的依据。
[0026]步骤9、根据步骤8选出残差最小的类别即为识别的结果。
[0027]在步骤1中,具体的方法为:使用专业摄像头,在正常光照情况对人脸图像进行采集,保证人脸处于图像的中央位置。
[0028]在步骤3中,采用的Gabor滤波器,其最主要使用优势体现在对物体纹理特征的提取上。Gabor滤波器对于图像的亮度和对比度变化以及图像姿态变化具有较强的鲁棒性,并且它表达的是对图像识别最为有用的局部特征,故在计算机视觉及纹理分析领域中得到广泛的应用。
[0029]在步骤4中的字典构建要保证D
N*K
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于多特征混合字典和概率预测机制的人脸识别方法,包括如下步骤:步骤1、将拍摄的图像转化为灰度图,并归一化;步骤2、将原灰度图划分为四个部分,对每一块进行单独的奇异值分解,得到每一块图像的奇异值特征向量,再将所有局部图像的奇异值特征向量与整体图像的奇异值特征向量组合起来得到一个局部与整体相结合的奇异值特征向量;组合的方法为:对各个局部图像的奇异值特征向量按照从上到下、从左到右的顺序排列,然后将整体图像的奇异值特征向量添加到排列好的向量的末尾,即得到局部与整体结合的特征向量;步骤3、对原灰度图利用Gabor滤波器组对输入图像进行卷积处理,将滤波结果图像划分为均等不重叠的图像子块,并对每个图像子块取灰度平均值,把所有图像子块的灰度平均值串联起来即形成表示图像的特征向量;步骤3、将基于奇异值分解的特征图和Gist特征融合,构建混合特征列向量;考虑到当构建原子的特征维度增加时,会导致原子的个数不满足远大于原子维度的约束条件,所以在这里对构建的混合特征进行PCA压缩操作;步骤4、将数据集按步骤3将所有图片转化为混合特征列向量后,将数据集按7:2:1的比例划分为训练集、验证集和测试集;将训练集的图像产生的混合特征向量构建混合特征字典D;步骤5、在解X0是足够稀疏的条件下,把L0范数下的最小值问题转化为求下面的L1范数最小值问题的解:(L1):Y0=argmin||Y||1s.t.Y=DX
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)从混合字典矩阵D中,计算信号y与字典矩阵中每列(原子)的内积,选择绝对值最大的一个原子,它就是与信号y在本次迭代运算中最匹配的,见公式(2);这样,信号y就被分解为在最匹配原子的垂直投影分量和残值两部分,即:再对分解的每一步对所选择的全部原子进行正交化处理,这使得在精度要求相同的情况下,能够增加算法的收敛速度;这样选择一个与信号y最匹...

【专利技术属性】
技术研发人员:王涌周王益潘宏赵远方
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1