本发明专利技术公开了一种大规模人脸图像检索方法,包含如下步骤:预处理;局部特征提取;全局几何特征提取;局部特征量化;全局几何特征量化;建立倒排索引;检索候选人脸图像集合;候选人脸图像集合重排序。本发明专利技术能够对大规模人脸图像库建立索引,实现快速的人脸检索,提高了检索效率。此外,通过嵌入辅助信息的特征量化和候选人脸图像集合重排序算法,提高了人脸检索的准确率。本发明专利技术实现了高效、准确的大规模人脸图像检索,因此具有较高的使用价值。
【技术实现步骤摘要】
本专利技术属于人脸图像检索领域,特别是。
技术介绍
近年来,随着微博和社交网站的兴起以及公共安全的需求,人脸图像的数据迅速增长到海量的规模,在这样一个海量的人脸数据库中,检索到自己感兴趣的一部分人脸图像已成为一个迫切的需求,大规模人脸检索也因此逐渐成为研究的热点。大规模人脸图像检索要求算法对数据规模具有很好的可扩展性,此外,检索效率、召回率和准确率等是评价检索性能的通用指标,不但要求检索效率高,还要保证检索的准确性。对于大规模人脸检索问题,如果直接使用传统的人脸识别的方法,提取的是高维复杂的特征且要线性遍历整个人脸库来寻找最相似的人脸,不具有可扩展性。简单利用基于内容的图像检索领域的词包模型(Bag-of-Words,Boff),由于没有利用人脸本身的特殊结构信息,量化的误差较大,因而检索准确率较低。目前主流的一些解决方案,如局部区块的基于ID量化编码的方法,通过利用人脸局部区块的位置信息这一先验知识来减小量化损失,同时使用多参考集重排序的方法来提高准确率,取得了较好的效果,但是,这些解决方案依然存在着人脸几何结构信息利用不足、量化损失和误差较大、参考集生成对年龄等变化不够鲁棒等问题,大规模人脸检索在性能上有待进一步提高。
技术实现思路
专利技术目的本专利技术为了解决现有技术中的问题,提出了,从而有效解决大规模数据下,人脸图像的快速准确检索问题。
技术实现思路
本专利技术公开了,包含如下步骤对待检索的人脸图像和人脸图像数据库中所有人脸图像分别进行以下步骤f步骤4的处理;步骤1,人脸图像预处理定位人脸图像中的关键点,并将人脸图像与预设的标准人脸图像对齐;步骤2,提取局部特征根据关键点位置将人脸图像分成P块,每一块称为一个局部块,提取每一个局部块的特征;步骤3,提取全局几何特征根据关键点位置,提取人脸图像全局几何特征,包括距离特征、角度特征以及曲率特征;步骤4,将人脸图像局部特征和全局几何特征量化为视觉单词利用训练集得到局部特征词典和全局特征词典,将人脸图像局部特征和全局几何特征量化为视觉单词;步骤5,对人脸图像数据库中的所有人脸图像建立倒排索引;步骤6,根据待检索人脸图像的视觉单词从步骤5的倒排索引中获得候选人脸图像集合;步骤7,利用重排序算法对候选人脸图像集合进行重排序,得到人脸图像参考集,人脸图像参考集为最终有序的检索结果。步骤I人脸图像预处理具体包括如下步骤首先,利用主动形状模型(Active Shape Model, ASM)定位人脸图像中的关键点,一个人脸的所有关键点的集合看作一个人脸形状,这些关键点组成的向量称为人脸形状向量。根据两个人脸形状向量,即两个人脸图像的关键点的集合,第i个人脸形状向量记为X1-(XiDyiUXcyc-HXir^yin),其中(Xij,YiJ)表示第i个人脸图像第j个关键点的坐标,其中j为fn中的任一数值,n为关键点个数,本专利技术优选76个,T表示矩阵的转置;一般关键点选取为10以上的自然数。给定人脸图像a和人脸图像b,其形状分别为Xa=(xal, yal, Xa2JyxanJan)1^ (Xbl,Ybl) Xb2> yb2> …Xbn,Ybn);找到参数组(0,s,t),使参数E= (Xa-M (s,0 ) -t) Tff (Xa-M (s, 0 ) _t)的值最小;一个人脸形状向量的转换用对其函数m(s,e) +t表示,其中权利要求1.,其特征在于,包含以下步骤对待检索的人脸图像和人脸图像数据库中所有人脸图像分别进行以下步骤f步骤4 的处理;步骤1,人脸图像预处理定位人脸图像中的关键点,并将人脸图像与预设的标准人脸图像对齐;步骤2,提取局部特征根据关键点位置将人脸图像分成P块,每一块称为一个局部块, 提取每一个局部块的特征;步骤3,提取全局几何特征根据关键点位置,提取人脸图像全局几何特征,包括距离特征、角度特征以及曲率特征;步骤4,将人脸图像局部特征和全局几何特征量化为视觉单词利用训练集得到局部特征词典和全局特征词典,将人脸图像局部特征和全局几何特征量化为视觉单词;步骤5,对人脸图像数据库中的所有人脸图像建立倒排索引;步骤6,根据待检索人脸图像的视觉单词从步骤5的倒排索引中获得候选人脸图像集合;步骤7,利用重排序算法对候选人脸图像集合进行重排序,得到人脸图像参考集,人脸图像参考集为最终有序的检索结果。2.根据权利要求I所述的一种大规模人脸检索方法,其特征在于,步骤I具体包括如下步骤定位关键点,对人脸图像中的关键点进行定位,关键点的集合作为人脸形状;将人脸图像与预设的标准人脸图像对齐包括,对于标准人脸图像a和任意人脸图像 b,其人脸形状分别为\和\,对齐过程即计算参数组(0,s,t),使E=(Xa-M(s,9)-t) tW(Xa-M(s, Θ) -t)最小,其中,M(s,Θ) +t表示对人脸图像b人脸形状向量的变换, M表示对齐函数,Θ表示旋转参数,s表示缩放参数,t表示位移参数,W是每个关键点的权值组成的对角矩阵;根据参数组(Θ,s,t),将人脸图像b与标准人脸图像a对齐。3.根据权利要求2所述的一种大规模人脸检索方法,其特征在于,步骤2中提取每一个局部块的特征包括局部二元模式和尺度不变特征转换两种特征。4.根据权利要求3所述的一种大规模人脸检索方法,其特征在于,步骤3提取全局几何特征具体包括关键点之间的空间几何关系,包括距离特征、角度特征和曲率特征。5.根据权利要求4所述的一种大规模人脸检索方法,其特征在于,步骤4中利用训练集得到局部特征词典和全局特征词典包括如下步骤定义视觉单词视觉单词包括Name ID, Age ID, Gender ID, Position ID;其中,对于局部特征,Name ID表示局部块所属人脸的姓名,Age ID表示局部块所属人脸的年龄段, Gender ID表不局部块所属人脸的性别,Position ID表不局部块在所属人脸中的编号;对于全局特征,Name ID表示全局特征对应人脸的姓名,Age ID表示全局特征对应人脸的年龄段,Gender ID表示全局特征对应人脸的性别,Position ID设为固定值p+q, q取值任意正整数;利用训练集生成局部特征词典过程如下对训练集中所有的人脸图像进行步骤广2, 并将训练集所有人脸图像的局部二元模式、尺度不变特征转换两种特征各自归入一个集合,每个集合称为局部特征集合;将每个局部特征集合中同一个年龄段、同一种性别和同一编号的局部特征作为一组,每组分别利用稀疏编码模型进行训练,得到一个局部特征词典, 该词典由一组特征向量组成,每个特征向量对应组中的一个局部特征,称为基;任意一个特征向量都由基的线性组合进行重构,线性组合的系数向量是特征向量的稀疏编码表示;利用训练集生成全局特征词典过程如下对训练集中所有的人脸图像进行步骤I和步骤3,将训练集中同一个年龄段、同一种性别的全局几何特征作为一组,每个组视为一个全局特征词典。6.根据权利要求5所述的一种大规模人脸检索方法,其特征在于,步骤4中将人脸图像局部特征和全局几何特征量化为视觉单词包括如下步骤对每一个人脸图像局部特征F1,根据相同特征种类、相同年龄段、相同性别和相同编号的人脸图像局部特征词典的基线性组合进行重构,得到系数向量中非零元素对应的基本文档来自技高网...
【技术保护点】
一种大规模人脸图像检索方法,其特征在于,包含以下步骤:对待检索的人脸图像和人脸图像数据库中所有人脸图像分别进行以下步骤1~步骤4的处理;步骤1,人脸图像预处理:定位人脸图像中的关键点,并将人脸图像与预设的标准人脸图像对齐;步骤2,提取局部特征:根据关键点位置将人脸图像分成p块,每一块称为一个局部块,提取每一个局部块的特征;步骤3,提取全局几何特征:根据关键点位置,提取人脸图像全局几何特征,包括距离特征、角度特征以及曲率特征;步骤4,将人脸图像局部特征和全局几何特征量化为视觉单词:利用训练集得到局部特征词典和全局特征词典,将人脸图像局部特征和全局几何特征量化为视觉单词;步骤5,对人脸图像数据库中的所有人脸图像建立倒排索引;步骤6,根据待检索人脸图像的视觉单词从步骤5的倒排索引中获得候选人脸图像集合;步骤7,利用重排序算法对候选人脸图像集合进行重排序,得到人脸图像参考集,人脸图像参考集为最终有序的检索结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:杨育彬,毛晓蛟,钱洪波,
申请(专利权)人:南京大学,
类型:发明
国别省市: