基于低秩表示的人体行为识别方法技术

技术编号:9434798 阅读:240 留言:0更新日期:2013-12-12 00:48
本发明专利技术公开了一种基于低秩表示的人体行为识别方法,主要解决现有技术对视频中的行为识别率低的问题。其识别过程为:(1)输入所有视频,利用k均值对所有行为检测到的局部特征进行聚类得到一个码书;(2)通过带有系数归一化约束的低秩表示LRR对每个视频的所有特征进行编码;(3)将每个视频的编码系数向量化,得到每个视频的最终表示;(4)将得到最终表示的所有视频分组,一组作为训练样本,一组作为测试样本,利用训练样本的视频表示组成字典;(5)基于新组成的字典上,利用稀疏表示对测试样本进行编码并确定测试样本的类标,完成测试样本中人体行为的识别。本发明专利技术增强了视频表示的判别性,提高了对视频中人体行为的识别率,可用于智能监控。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种,主要解决现有技术对视频中的行为识别率低的问题。其识别过程为:(1)输入所有视频,利用k均值对所有行为检测到的局部特征进行聚类得到一个码书;(2)通过带有系数归一化约束的低秩表示LRR对每个视频的所有特征进行编码;(3)将每个视频的编码系数向量化,得到每个视频的最终表示;(4)将得到最终表示的所有视频分组,一组作为训练样本,一组作为测试样本,利用训练样本的视频表示组成字典;(5)基于新组成的字典上,利用稀疏表示对测试样本进行编码并确定测试样本的类标,完成测试样本中人体行为的识别。本专利技术增强了视频表示的判别性,提高了对视频中人体行为的识别率,可用于智能监控。【专利说明】
本专利技术属于机器学习、计算机视觉领域,涉及对视频中人物行为的识别,可用于视频中目标检测及跟踪的后处理。
技术介绍
人体行为识别包括从视频序列中抽取相关的视觉信息,并用一种合适的方式进行表达,最后解释这些信息以实现学习和识别人的行为,研究人体的行为模式将为人们的生活带来全新的交互方式。近年来,特征包BoF模型被成功应用于图像分类和行为识别领域。在行为识别领域,它把视频序列描述成一系列视觉关键词的统计直方图。视觉关键词统计直方图的构建分为以下几个步骤:第一步,利用局部特征检测器,如Harris3D检测子,Hessian检测子,Cuboid检测子等,自动检测出视频中感兴趣的区域,并用相应的描述子对其进行描述;第二步,利用K均值将所有视频局部特征描述符进行聚类,形成若干个聚类中心,即视觉关键词,聚类中心的个数或称词包的大小可事先由人为确定。第三步,计算每个视频中局部特征描述符与每个聚类中心的欧式距离,距离最小的聚类中心被认为是该局部特征的视觉关键词,统计视频中所有局部特征关键词的数目,形成视觉关键词直方图。尽管特征包模型简单有效,但由于视频中的局部特征数目多而且复杂,需要成千上万个视觉关键词才能 获得比较好的识别结果,而且特征包模型并没有考虑视觉关键词的内部结构?目息。2010年,X.Yan等人将特征包模型与有效人体区域包结合在一起,由于有效人体区域包描述了两个局部特征的关系,这样就弥补了特征包没有考虑局部特征之间关系的不足。参见 X.Yan, Y.Luo, ((Making full use of spatial-temporal interest points:anadaboost approach for action recognition)) , International Conference on ImageProcessing。2010年,Y.Zhu等人将局部特征与稀疏表示结合在一起,提出了一个新的具有判别性表达方式,参见 Y.Zhu, X.Zhao, Y.Fu, Y.Liu,《Sparse coding on localspatial-temporal volumes for human action recognition)), Asian Conference onComputer Vision。2011年,Z.Lu等人通过I1图的构建和谱嵌入结合起来。该方法考虑了视觉关键词的流形结构,其得到的表示是紧致的而且具有判别性。参见Z.Lu,Y.Peng,《Latentsemantic learning with structured sparse representation for human actionrecognition)), ICCV0以上提到的改善方法均存在以下不足:只考虑稀疏性,没有考虑数据的整体结构性,所以无法获取视频局部特征中的全局结构信息,识别率低。
技术实现思路
本专利技术的目的在于针对上述已有技术的不足,提出一种,以获取视频局部特征中的全局结构信息,提高识别率。实现本专利技术的技术思路是:考虑视觉关键词的全局结构,对所获取的局部特征进行编码,将其应用到人体行为识别领域,具体步骤如下:(I)输入所有视频,每个视频中只含有一种行为,利用Cuboid特征检测和描述算法中的Cuboid检测子和描述子分别对视频中的行为进行局部特征检测和描述;(2)利用k均值法,对所有视频的行为局部特征进行聚类,形成一个码书:【权利要求】1.一种,包括如下步骤: (1)输入所有视频,每个视频中只含有一种行为,利用Cuboid特征检测和描述算法中的Cuboid检测子和描述子分别对视频中的行为进行局部特征检测和描述; (2)利用k均值法,对所有视频的行为局部特征进行聚类,形成一个码书:A=∈Rd*l其中:ak表示每个聚类中心,k=l, 2,…,1,I表示聚类中心的个数,d表示聚类中心的维数; (3)利用带有系数归一化约束的低秩表示LRR,在码书A上对每个视频中的行为所包含的局部特征进行编码: (3a)假设视频中的行为有11个局部特征,用X=∈Rd*n表示,其中:Xi表示第i个局部特征,i=l, 2,…,n, d表示局部特征的维数; (3b)在码书A上,利用如下公式进行编码: 【文档编号】G06K9/00GK103440471SQ201310163241【公开日】2013年12月11日 申请日期:2013年5月5日 优先权日:2013年5月5日 【专利技术者】张向荣, 焦李成, 杨浩, 杨阳, 侯彪, 王爽, 马文萍, 马晶晶 申请人:西安电子科技大学本文档来自技高网
...

【技术保护点】
一种基于低秩表示的人体行为识别方法,包括如下步骤:(1)输入所有视频,每个视频中只含有一种行为,利用Cuboid特征检测和描述算法中的Cuboid检测子和描述子分别对视频中的行为进行局部特征检测和描述;(2)利用k均值法,对所有视频的行为局部特征进行聚类,形成一个码书:其中:ak表示每个聚类中心,k=1,2,…,l,l表示聚类中心的个数,d表示聚类中心的维数;(3)利用带有系数归一化约束的低秩表示LRR,在码书A上对每个视频中的行为所包含的局部特征进行编码:(3a)假设视频中的行为有n个局部特征,用表示,其中:xi表示第i个局部特征,i=1,2,…,n,d表示局部特征的维数;(3b)在码书A上,利用如下公式进行编码:minZ,E||Z||*+λ||E||2,1,s.t.X=AZ+E,1Z=1^其中:Z表示局部特征在码书A上的编码系数,E表示噪声,‖·‖*表示一种矩阵奇异值之和的核函数,参数λ用来权衡低秩和噪声的影响,‖E‖2,1表示对E的l2,1范数,Eij为E的第i行第j列元素,矩阵1和中每个元素均为1;(3c)利用中间变量J代替(3b)中的Z,将编码公式转化为:minZ,E,J||J||*+λ||E||2,1,s.t.X=AZ+E,Z=J,1Z=1^由此将对Z的多约束优化问题简化为对J的单约束优化,利用增强拉格朗日乘子ALM算法对该公式进行求解,得到一个行为的所有局部特征对应的编码系数(4)对每个人体行为的局部特征,根据步骤(3c)中得到的编码系数,应用max pooling算法,将每个人体行为表示成一个l维的列向量:z*=[z^1,z^2,...,z^k,...,z^l]T,k=1,2,...,l其中z^k=max(|zk1|,|zk2|,...,|zki|,...,|zkn|),i=1,2,...,n,zki表示Z的第k行第i列元素;(5)把一个动作者的所有行为视频作为测试样本集,其他动作者的所有行为视频作为训练集,训练集样本个数为m,利用所有训练样本的编码系数组成字典其中m是字典原子个数,j是字典的类别标号,c为总类别数;(6)利用随机生成的线性变换矩阵对每个测试样本进行降维,b<<l,得到降维后的测试样本:并通过下式得到每个测试样本的编码系数β:minβ||y^-RDβ||22+η||β||1,其中,‖·‖2表示向量的l2范数,‖·‖1表示向量的l1范数,R均值为0,方差为1,D是训练样本组成的字典,η是用于平衡重建误差和编码稀疏性的参数,取值范围为0?1;(7)计算测试样本在每类字典上的残差rj(y^)=||y^-RDjβj||22/||βj||2,j=1,2,...,c其中:βj是测试样本在第j类字典Dj上的编码系数,如果在第j类字典上的残差最小,则赋予测试样本的类标为j;(8)重复步骤(5)?(7),依次对每个动作者的所有行为进行分类,得到所有动作者的所有行为类标,并用分类标号对应不同的人体行为。FDA00003144074500011.jpg,FDA00003144074500012.jpg,FDA00003144074500014.jpg,FDA00003144074500015.jpg,FDA00003144074500016.jpg,FDA00003144074500018.jpg,FDA00003144074500023.jpg,FDA00003144074500024.jpg,FDA00003144074500025.jpg,FDA00003144074500026.jpg,FDA00003144074500028.jpg...

【技术特征摘要】

【专利技术属性】
技术研发人员:张向荣焦李成杨浩杨阳侯彪王爽马文萍马晶晶
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1