【技术实现步骤摘要】
本专利技术属于计算机视觉领域的移动目标识别技术,特别是一种邻域高斯结构和视频特征融合的动作识别方法。
技术介绍
提高视频中目标识别的准确率是开展图像科学研究的不懈追求,高效的计算机自动识别目标技术,对公共安全等领域具有重大意义。目标识别的过程主要分为训练和非训练两种方法,传统训练方法的识别严重依赖于样本的数量,且分类过程容易产生过拟合问题。现阶段,目标识别技术主要采用非训练的新方法。LARK特征由Seo等人在2010年提出,与HOG特征,LBP特征,Haar特征,SIFT特征等相比,具有旋转和尺度不变性,抓住图像潜在结构而不受噪声影响和稳定性好等优点。它关注每个像素点灰度变化,鲁棒的描述了图像的局部结构。但是Seo的方法使用单尺度模板,不能识别多尺度目标。模板包含背景,采用目标与模板整体匹配,导致待测视频适用场景有限,与模板背景不类似的视频,检测效果不好。LARK特征是局部特征,不能描述目标整体的形状。对于结构稳定的目标,使用LARK特征识别效果较好,对于姿态变化多的非紧凑型目标,则不能排除结构与目标类似的物体。
技术实现思路
本专利技术的目的是提供一种邻域高斯结构和视频特征融合的动作识别方法。实现本专利技术目的的技术解决方案为:一种邻域高斯结构和视频特征融合的动作识别方法,具体步骤为:步骤1、构建无背景多尺度模板,具体是:首先将模板图片转成灰度图,之后将图片的背景去除,最后对其进行缩放处理;步骤2、对步骤1得到的多尺度模板进行3DLARK特征提取,之后对提取出的3DLARK特征进行去冗余处理;步骤3、对步骤2得到的特征向量矩阵WQ邻域窗口内的数据进行高斯拟 ...
【技术保护点】
一种邻域高斯结构和视频特征融合的动作识别方法,其特征在于,具体步骤为:步骤1、构建无背景多尺度模板,具体是:首先将模板图片转成灰度图,之后将图片的背景去除,最后对其进行缩放处理;步骤2、对步骤1得到的多尺度模板进行3D LARK特征提取,之后对提取出的3D LARK特征进行去冗余处理;步骤3、对步骤2得到的特征向量矩阵WQ邻域窗口内的数据进行高斯拟合,之后对高斯拟合后的结果进行去冗余处理;步骤4、将待测视频转换为灰度视频,然后提取显著区域,之后再提取显著区域内像素点的3D LARK特征,最后进行单个向量去冗余处理;步骤5、将待测视频3D LARK特征集FT邻域9×9窗口内的数据进行高斯多维拟合,之后对高斯多维拟合后的结果进行去冗余处理,得到:R为实数域,m2为9×9窗口遍历待测视频后的循环次数;步骤6、对3D LARK特征和邻域高斯结构特征的模板与待测视频进行局部匹配,并记录向量位置信息;步骤7、对向量位置信息进行统计,具体是确定统计窗口内不重复的索引值个数,分别得到目标存在的统计概率矩阵T3DLK和TNRFM;步骤8、将统计概率矩阵T3DLK和TNRFM相乘融合得到最终的统计概率矩阵 ...
【技术特征摘要】
1.一种邻域高斯结构和视频特征融合的动作识别方法,其特征在于,具体步骤为:步骤1、构建无背景多尺度模板,具体是:首先将模板图片转成灰度图,之后将图片的背景去除,最后对其进行缩放处理;步骤2、对步骤1得到的多尺度模板进行3DLARK特征提取,之后对提取出的3DLARK特征进行去冗余处理;步骤3、对步骤2得到的特征向量矩阵WQ邻域窗口内的数据进行高斯拟合,之后对高斯拟合后的结果进行去冗余处理;步骤4、将待测视频转换为灰度视频,然后提取显著区域,之后再提取显著区域内像素点的3DLARK特征,最后进行单个向量去冗余处理;步骤5、将待测视频3DLARK特征集FT邻域9×9窗口内的数据进行高斯多维拟合,之后对高斯多维拟合后的结果进行去冗余处理,得到:R为实数域,m2为9×9窗口遍历待测视频后的循环次数;步骤6、对3DLARK特征和邻域高斯结构特征的模板与待测视频进行局部匹配,并记录向量位置信息;步骤7、对向量位置信息进行统计,具体是确定统计窗口内不重复的索引值个数,分别...
【专利技术属性】
技术研发人员:柏连发,张毅,韩静,崔议尹,
申请(专利权)人:南京理工大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。