当前位置: 首页 > 专利查询>宁波大学专利>正文

一种基于稀疏表示的Multi-shot行人再识别方法技术

技术编号:22076572 阅读:29 留言:0更新日期:2019-09-12 14:25
本发明专利技术公开了一种基于稀疏表示的Multi‑shot行人再识别方法,其采用K‑means聚类算法将第一图像库对应的每个特征向量集合中的所有GOG特征向量聚为多簇,将第二图像库对应的每个特征向量集合中的所有GOG特征向量聚为多簇,将每簇中的所有GOG特征向量的均值特征向量作为相应的特征表示,这样消除了冗余信息,提高了行人再识别的速度;同时,结合了核局部费舍尔判别算法学习内嵌空间的策略,进一步消除了光照变化和视角变化对行人再识别的影响,提高了行人再识别的准确率;能同时有效地利用第一图像库中同一行人的各行人图像间的相关性信息和第二图像库中同一行人的各行人图像间的相关性信息,使得构建的联合组稀疏表示模型对物体遮挡和人体姿态变化具有更高的鲁棒性。

A Multi-shot Pedestrian Recognition Method Based on Sparse Representation

【技术实现步骤摘要】
一种基于稀疏表示的Multi-shot行人再识别方法
本专利技术涉及一种图像识别技术,尤其是涉及一种基于稀疏表示的Multi-shot行人再识别方法。
技术介绍
给定一个摄像机视角(称为待测视角)中感兴趣的行人图像,行人再识别的目标是从另一个、不相连的摄像机视角(称为目标视角)中自动重新识别同一个人。现如今很多计算机视觉中的高层应用都依赖于准确的行人识别结果,如目标跟踪、智能视频监控等。由于行人图像容易受到光照变化、人体姿态变化、遮挡等因素的影响,使得行人再识别一直是计算机视觉领域中最具有挑战性的任务之一。如何准确地对行人进行再识别,国内外相关机构进行了深入地研究。目前,关于行人再识别的研究主要集中在两个方面:(1)每个摄像机视角下的每个行人仅有一幅行人图像的情况(简称Single-shot);(2)每个摄像机视角下的每个行人具有一个行人图像序列(即多幅行人图像)的情况(简称Multi-shot)。由于单幅行人图像中包含的信息非常有限,因此导致Single-shot行人再识别方法对人体姿态变化和物体遮挡不够鲁棒。实际上,随着计算机存储能力的提高,每个摄像机视角下每个行人能够获得一个行人图像序列,这意味着,可以通过利用相同行人图像序列中的多幅行人图像来获得额外的先验信息,因此,Multi-shot行人再识别方法越来越受到了关注。最近几年,Multi-shot行人再识别已取得了不错的进展。如:LiY,WuZ,KaranamS,etal.Multi-ShotHumanRe-IdentificationUsingAdaptiveFisherDiscriminantAnalysis[C]//BritishMachineVisionConference(BMVC).2015:73.1-73.12.(李阳、吴子衍、卡拉南·斯里克里希纳,使用自适应Fisher判别分析的多重人类重新识别,英国机器视觉会议,2015,73.1-73.12),其提出了一种特征变换算法,该算法结合了分层图像序列聚类和Fisher判别分析来学习判别特征空间。又如:T.Wang,S.Gong,X.Zhu,S.Wang.Personre-identificationbyvideoranking[C]//EuropeanConferenceonComputerVision(ECCV),2014:688-703.(王太清、龚绍刚、朱夏天、王胜金,基于视频排名的行人再识别,欧洲计算机视觉会议,2014,688–703),其描述了Multi-shot行人再识别为图像序列匹配问题,考虑相关时间概念,使用基于量化空间和时间梯度的紧凑描述符对视频片段进行排序。再如:Y.Li,Z.Wu,andR.J.Radke,Multi-shotre-identificationwithrandom-projection-basedrandomforests[C]//ApplicationsofComputerVision(WACV),2015IEEEWinterConferenceon.IEEE,2015:373–380.(李阳、吴子衍、拉德克·理查德,基于随机投影的随机森林多目行人再识别,计算机视觉应用,2015IEEE冬季会议,2015,373-380),其提出了学习多个个性化的判别随机森林来对每个行人对应的多个实例数据进行分类。尽管上述各种方法已取得了一定的效果,但是对背景杂乱和遮挡还不够鲁棒。稀疏表示(SparseRepresentation,SR)在计算机视觉及图像处理领域已得到了广泛的应用,例如人脸识别、目标跟踪、图像去噪、图像超分辨率重构等。因基于稀疏表示的行人再识别能够有效地抵抗噪声、处理部分遮挡和图像损坏,而得到了广泛的关注。如:M.I.Khedher,M.A.ElYacoubi,andB.Dorizzi,Multi-shotsurf-basedpersonre-identificationviasparserepresentation[C]//AdvancedVideoandSignalBasedSurveillance(AVSS),201310thIEEEInternationalConferenceon.IEEE,2013:159–164.(赫德赫·穆罕默德·伊本、埃尔亚库比·蒙尼姆、多瑞兹·贝尔纳黛特,基于稀疏表示的加速鲁棒特征的多目行人再识别,高级视频和信号监控(AVSS),2013年第10届IEEE国际会议,2013,159-164),其提出了一幅待测行人图像可由来自目标集的同一行人图像进行线性表示,通过将目标集中的所有图像特征向量作为原子,构造一个字典,将行人再识别问题转化为求解稀疏表示模型中的稀疏表示系数及待测样本重构误差的问题。又如:G.Lisanti,I.Masi,A.D.Bagdanov,andA.DelBimbo.Personre-identificationbyiterativere-weightedsparseranking[J]IEEEtransactionsonpatternanalysisandmachineintelligence,2015:1629–1642(利桑蒂·朱塞佩、马西·亚科波、巴格丹诺夫·安德鲁·D、德尔宾博·阿尔韦托,基于迭代重加权稀疏排名的行人再识别,模式分析和机器智能,2015,1629-1642),其提出了一种迭代稀疏排序方法,其通过结合软阈值和硬阈值重加权策略在最相关的贡献元素之间重新分配权重,并确保在每次迭代中对权重最大的字典原子进行排序。上述基于稀疏表示的行人再识别方法的一个局限性是独立地看待字典中的原子。考虑到目标集中的每个行人具有一个序列的图像,稀疏表示字典应具有组结构特性。如:S.Karanam,Y.Li,andR.J.Radke.Sparsere-id:Blocksparsityforpersonre-identification[C]//ComputerVisionandPatternRecognition(CVPR),2015:33-40.(卡拉南·斯里克里希纳、李阳、拉德克·理查德,基于块稀疏表示的行人再识别,计算机视觉和模式识别,2015:33-40),其提出了一种块稀疏表示方法,其通过将目标集中同一行人序列内的所有图像定为一个组,块稀疏表示不是期望稀疏系数中具有尽可能少的非零元素,而是认为非零系数应该集中在某一特定的组中,然而,虽然块稀疏表示方法已经考虑了目标集中同一行人图像序列内各图像间的相关性信息,但是其仍然逐个地稀疏编码每一幅待测图像,忽略了待测图像库中同一行人序列内各图像间的相关性信息(由于待测图像库中同一行人序列内的各图像比较相似,因此它们之间存在一些互补信息)。基于以上原因,有必要研究一种基于稀疏表示的Multi-shot行人再识别方法,要求该方法不仅能够充分利用目标库中同一行人序列内各图像间的相关性信息,同时还要充分利用待测图像库中同一行人序列内各图像间的相关性信息,进而提高行人识别率。
技术实现思路
本专利技术所要解决的技术问题是提供一种基于稀疏表示的Multi-shot行人再识别方法,其对人体姿态变化和物体遮挡的鲁棒性好,提高了行人再识别的准确率。本专利技术解本文档来自技高网
...

【技术保护点】
1.一种基于稀疏表示的Multi‑shot行人再识别方法,其特征在于包括以下步骤:步骤一:在不同地点设置第一摄像头A和第二摄像头B;然后利用第一摄像头A对Nperson个行人进行拍摄,针对第i个行人拍摄NA,i幅行人图像,将第一摄像头A拍摄的所有行人图像构成第一图像库;在不同时刻利用第二摄像头B对相同的Nperson个行人进行拍摄,针对第i个行人拍摄NB,i幅行人图像,将第二摄像头拍摄的所有行人图像构成第二图像库;其中,Nperson≥300,且Nperson为偶数,i为正整数,i的初始值为1,1≤i≤Nperson,NA,i≥10,NB,i≥10;步骤二:提取第一图像库中的每幅行人图像的GOG特征向量;同样提取第二图像库中的每幅行人图像的GOG特征向量;步骤三:由第一图像库中针对每个行人的多幅行人图像的GOG特征向量构成一个特征向量集合,将由第一图像库中针对第i个行人的NA,i幅行人图像的GOG特征向量构成的特征向量集合记为SA,i,

【技术特征摘要】
1.一种基于稀疏表示的Multi-shot行人再识别方法,其特征在于包括以下步骤:步骤一:在不同地点设置第一摄像头A和第二摄像头B;然后利用第一摄像头A对Nperson个行人进行拍摄,针对第i个行人拍摄NA,i幅行人图像,将第一摄像头A拍摄的所有行人图像构成第一图像库;在不同时刻利用第二摄像头B对相同的Nperson个行人进行拍摄,针对第i个行人拍摄NB,i幅行人图像,将第二摄像头拍摄的所有行人图像构成第二图像库;其中,Nperson≥300,且Nperson为偶数,i为正整数,i的初始值为1,1≤i≤Nperson,NA,i≥10,NB,i≥10;步骤二:提取第一图像库中的每幅行人图像的GOG特征向量;同样提取第二图像库中的每幅行人图像的GOG特征向量;步骤三:由第一图像库中针对每个行人的多幅行人图像的GOG特征向量构成一个特征向量集合,将由第一图像库中针对第i个行人的NA,i幅行人图像的GOG特征向量构成的特征向量集合记为SA,i,同样,由第二图像库中针对每个行人的多幅行人图像的GOG特征向量构成一个特征向量集合,将由第二图像库中针对第i个行人的NB,i幅行人图像的GOG特征向量构成的特征向量集合记为SB,i,其中,fA,i,1表示第一图像库中针对第i个行人的第1幅行人图像的GOG特征向量,fA,i,2表示第一图像库中针对第i个行人的第2幅行人图像的GOG特征向量,表示第一图像库中针对第i个行人的第NA,i幅行人图像的GOG特征向量,fB,i,1表示第二图像库中针对第i个行人的第1幅行人图像的GOG特征向量,fB,i,2表示第二图像库中针对第i个行人的第2幅行人图像的GOG特征向量,表示第二图像库中针对第i个行人的第NB,i幅行人图像的GOG特征向量,fA,i,1、fA,i,2、fB,i,1、fB,i,2、的维数均为d×1;步骤四:采用K-means聚类算法将第一图像库对应的每个特征向量集合中的所有GOG特征向量聚为k簇;同样,采用K-means聚类算法将第二图像库对应的每个特征向量集合中的所有GOG特征向量聚为k簇;然后计算第一图像库对应的每个特征向量集合所对应的每簇中的所有GOG特征向量的均值特征向量,将SA,i所对应的第α簇中的所有GOG特征向量的均值特征向量记为同样,计算第二图像库对应的每个特征向量集合所对应的每簇中的所有GOG特征向量的均值特征向量,将SB,i所对应的第α簇中的所有GOG特征向量的均值特征向量记为再将第一图像库对应的每个特征向量集合所对应的k个均值特征向量构成一个新的特征向量集合,将SA,i所对应的k个均值特征向量构成一个新的特征向量集合记为同样,再将第二图像库对应的每个特征向量集合所对应的k个均值特征向量构成一个新的特征向量集合,将SB,i所对应的k个均值特征向量构成一个新的特征向量集合记为其中,k表示聚类的个数,k≥1,α为正整数,α的初始值为1,1≤α≤k,表示SA,i所对应的第1簇中的所有GOG特征向量的均值特征向量,表示SA,i所对应的第2簇中的所有GOG特征向量的均值特征向量,表示SA,i所对应的第k簇中的所有GOG特征向量的均值特征向量,表示SB,i所对应的第1簇中的所有GOG特征向量的均值特征向量,表示SB,i所对应的第2簇中的所有GOG特征向量的均值特征向量,表示SB,i所对应的第k簇中的所有GOG特征向量的均值特征向量,的维数均为d×1;步骤五:将第一图像库对应的第1个新的特征向量集合至第Nperson/2个新的特征向量集合构成一个集合,记为TA,同样将第二图像库对应的第1个新的特征向量集合至第Nperson/2个新的特征向量集合构成一个集合,记为TB,然后将TA和TB构成训练数据集合,记为TAB,TAB={TA,TB};再将第一图像库对应的第Nperson/2+1个新的特征向量集合至第Nperson个新的特征向量集合构成一个集合,记为GA,同样,将第二图像库对应的第Nperson/2+1个新的特征向量集合至第Nperson个新的特征向量集合构成一个集合,记为QB,其中,表示第一图像库对应的第1个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第一图像库对应的第2个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第一图像库对应的第Nperson/2个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第一图像库对应的第Nperson/2+1个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第一图像库对应的第Nperson个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第二图像库对应的第1个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第二图像库对应的第2个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第二图像库对应的第Nperson/2个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第二图像库对应的第Nperson/2+1个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合,表示第二图像库对应的第Nperson个特征向量集合所对应的k个均值特征向量构成的新的特征向量集合;步骤六:采用核局部费舍尔判别算法对训练数据集合TAB进行学习,得到一个内嵌空间投影矩阵,记为H;然后将GA中的所有特征向量都通过内嵌空间投影矩阵H投影到内嵌空间中,将内嵌空间中的所有特征向量构成的集合记为同样,将QB中的所有特征向量都通过内嵌空间投影矩阵H投影到内嵌空间中,将内嵌空间中的所有特征向量构成的集合记为其中,H的维数为d×m,m表示内嵌空间的维度,m≥50;表示第一图像库中针对第Nperson/2+1个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第1簇中的所有GOG特征向量的均值特征向量在内嵌空间中的特征向量,表示第一图像库中针对第Nperson/2+1个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第k簇中的所有GOG特征向量的均值特征向量在内嵌空间中的特征向量,表示第一图像库中针对第Nperson个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第1簇中的所有GOG特征向量的均值特征向量在内嵌空间中的特征向量,表示第一图像库中针对第Nperson个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第k簇中的所有GOG特征向量的均值特征向量在内嵌空间中的特征向量,表示第二图像库中针对第Nperson/2+1个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第1簇中的所有GOG特征向量的均值特征向量在内嵌空间中的特征向量,表示第二图像库中针对第Nperson/2+1个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第k簇中的所有GOG特征向量的均值特征向量在内嵌空间中的特征向量,表示第二图像库中针对第Nperson个行人的幅行人图像的GOG特征向量构成的特征向量集合所对应的第1簇中的所有GOG特征向量的均值特征向量在内嵌空...

【专利技术属性】
技术研发人员:李小宝郭立君张荣
申请(专利权)人:宁波大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1