【技术实现步骤摘要】
基于多模态特征级融合的人体动作识别系统及其识别方法
[0001]本专利技术涉及人体动作智能识别的领域,且更为具体地,涉及一种基于多模态特征级融合的人体动作识别系统及其识别方法。
技术介绍
[0002]“察言观色”是正常人类的基本生活交流能力,对人类动作和行为的分析和理解是现代心理学的主要研究内容之一。随着人工智能的发展和人类计算能力的提升,人体动作识别逐渐成为计算机视觉以及图像处理领域的研究热点之一,该方向不仅拥有重要的理论研究价值,还有着广泛的应用前景。其主要原因是人体动作识别在人机交互、健康监护、智能安防、视频分析等研究领域中的潜在应用价值。因此,需要一种优化的人体动作识别系统。
[0003]目前,深度学习以及神经网络已经广泛应用于计算机视觉、自然语言处理、文本信号处理等领域。此外,深度学习以及神经网络在图像分类、物体检测、语义分割、文本翻译等领域,也展现出了接近甚至超越人类的水平。
[0004]近年来,深度学习以及神经网络的发展,为人体的动作识别提供了解决思路和方案。
技术实现思路
[0005]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种基于多模态特征级融合的人体动作识别系统及其识别方法,其通过基于短时傅里叶变化和小波包分解从待检测人体的重心在预设时间段内的加速度信号中提取频域和时域的样本数据,并使用深度神经网络模型来提取出所述加速度信号的时频域样本信息中的动态隐含关联特征,并且在特征融合的过程中,通过计算真值度量距离向量以减小特征向量间的在高维空间内的按位置特征 ...
【技术保护点】
【技术特征摘要】
1.一种基于多模态特征级融合的人体动作识别系统,其特征在于,包括:单模态数据获取单元,用于获取待检测人体的重心在预设时间段内的加速度信号;频域特征提取单元,用于基于短时傅里叶变化从所述加速度信号提取频域样本数据;时域特征提取单元,用于基于小波包分解从所述加速度信号提取时域样本数据;时频域特征编码单元,用于将所述频域样本数据和所述时域样本数据通过包含一维卷积层和全连接层的时序编码器以获得对应于所述频域样本数据的第一特征向量和对应于时域样本数据的第二特征向量;第一校正单元,用于基于所述第一特征向量和所述第二特征向量之间的均值向量来计算所述第一特征向量的真值度量距离向量作为校正后第一特征向量,其中,所述第一特征向量的真值度量距离向量的各个位置的特征值为以所述第一特征向量的各个位置的特征值减去所述均值向量的各个位置的特征值之差为幂的自然指数函数值为分子除以以所述第一特征向量的各个位置的特征值减去所述均值向量的各个位置的特征值之差为幂的自然指数函数值乘以所述第二特征向量的各个位置的特征值减去所述均值向量的各个位置的特征值之差为幂的自然指数函数值为分母;第二校正单元,用于基于所述第一特征向量和所述第二特征向量之间的均值向量来计算所述第二特征向量的真值度量距离向量作为校正后第二特征向量,其中,所述第二特征向量的真值度量距离向量的各个位置的特征值为以所述第二特征向量的各个位置的特征值减去所述均值向量的各个位置的特征值之差为幂的自然指数函数值为分子除以以所述第二特征向量的各个位置的特征值减去所述均值向量的各个位置的特征值之差为幂的自然指数函数值乘以所述第一特征向量的各个位置的特征值减去所述均值向量的各个位置的特征值之差为幂的自然指数函数值为分母;特征融合单元,用于融合所述校正后第一特征向量和所述校正后第二特征向量以获得分类特征向量;以及动作识别单元,用于将所述分类特征向量通过具有多标签的分类器以获得分类结果,所述分类结果为待检测人体的动作类型。2.根据权利要求1所述的基于多模态特征级融合的人体动作识别系统,其中,所述时频域特征编码单元,进一步用于:将所述频域样本数据排列为频域输入向量;使用所述时序编码器的全连接层以如下公式对所述频域输入向量进行全连接编码以提取出所述频域输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:其中X是所述输入向量,Y是输出向量,W是权重矩阵,B是偏置向量,表示矩阵乘;使用所述时序编码器的一维卷积层以如下公式对所述频域输入向量进行一维卷积编码以提取出所述频域输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸;将所述时域样本数据排列为时域输入向量;使用所述时序编码器的全连接层以如下公式对所述时域输入向量进行全连接编码以提取出所述时域输入向量中各个位置的特征值的高维隐含特征,其中,所述公式为:的高维隐含特征,其中,所述公式为:其中X是所述输入向量,Y是输出向量,W是权重矩阵,B是偏置向量,表示矩阵乘;使用所述时序编码器的一维卷积层以如下
公式对所述时域输入向量进行一维卷积编码以提取出所述时域输入向量中各个位置的特征值间的高维隐含关联特征,其中,所述公式为:其中,a为卷积核在x方向上的宽度、F为卷积核参数向量、G为与卷积核函数运算的局部向量矩阵,w为卷积核的尺寸。3.根据权利要求2所述的基于多模态特征级融合的人体动作识别系统,其中,所述第一校正单元,进一步用于:基于所述第一特征向量和所述第二特征向量之间的均值向量以如下公式来计算所述第一特征向量的真值度量距离向量作为所述校正后第一特征向量;其中,所述公式为:其中,V1表示所述第一特征向量,V2表示所述第二特征向量,表示所述第一特征向量和所述第二特征向量之间的均值向量,V
′1表示所述校正后第一特征向量,分别表示向量的按位置减法和加法,exp(
·
)表示向量的指数运算,以向量为幂的自然常数的指数运算表示以向量的每个位置的值作为幂求指数,再获得计算运算结果的向量,且分子向量除以分母向量就是向量的按位置相除。4.根据权利要求3所述的基于多模态特征级融合的人体动作识别系统,其中,所述第二校正单元,进一步用于:基于所述第一特征向量和所述第二特征向量之间的均值向量以如下公式来计算所述第二特征向量的真值度量距离向量作为所述校正后第二特征向量;其中,所述公式为:其中,V1表示所述第一特征向量,V2表示所述第二特征向量,表示所述第一特征向量和所述第二特征向量之间的均值向量,V
′2表示所述校正后第二特征向量,分别表示向量的按位置减法和加法,exp(
·
)表示向量的指数运算,以向量为幂的自然常数的指数运算表示以向量的每个位置的值作为幂求指数,再获得计算运算结果的向量,且分子向量除以分母向量就是向量的按位置相除。5.根据权利要求4所述的基于多模态特征级融合的人体动作识别系统,其中,所述特征融合单元,进一步用于:以如下公式融合所述校正后第一特征向量和所述校正后第二特征向量以获得所述分类特征向量;其中,所述公式为:V=αV
′1+βV
′2其中V
′1表示所述校正后第一特征向量,V
′2表示所述校正后第二特征向量,V表示所述分类特征向量,“+”表示所述校正后第一特征向量和所述校正后第二特征向量相对应位置处的元素相加,α和β为用于控制所述分类特征向量中所述校正后第一特征向量和所述校正
后第二特征向量之...
【专利技术属性】
技术研发人员:胡秀芬,
申请(专利权)人:浙江绍兴少宫数码科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。