基于时间多尺度自适应特征聚合的骨架行为识别方法技术

技术编号:38816274 阅读:9 留言:0更新日期:2023-09-15 19:55
本发明专利技术公开了一种基于时间多尺度自适应特征聚合的骨架行为识别方法,包括:将获取的骨架序列数据输入预先训练好的时空图卷积网络;其中,时空图卷积网络包括依次连接的多级时空图卷积层,每级时空图卷积层包括:空间卷积模块、时间卷积模块和多尺度自适应特征聚合模块;根据时间卷积模块输出的时间特征图与多尺度自适应特征聚合模块输出的第一输出特征图,确定每级时空图卷积层的输出特征图,并将输出特征图作为下一级时空图卷积层的输入数据;根据最后一级时空图卷积层的输出特征图,输出骨架序列数据的行为识别结果。本发明专利技术能够提高对于骨架序列数据的时序特征提取能力,从而提高了时空图卷积网络行为识别的准确性。而提高了时空图卷积网络行为识别的准确性。而提高了时空图卷积网络行为识别的准确性。

【技术实现步骤摘要】
基于时间多尺度自适应特征聚合的骨架行为识别方法


[0001]本专利技术属于深度学习
,具体涉及一种基于时间多尺度自适应特征聚合的骨架行为识别方法。

技术介绍

[0002]目前,在深度学习领域,人体行为识别方法可以划分为基于RGB视频的行为识别方法和基于骨架的行为识别方法;其中,基于RGB视频的行为识别方法通常以RGB图像序列、视频或者这些模态的特定融合如RGB图像和光流作为模型输入,相比于人体骨架数据,前述模态会产生更多的计算消耗,并且在面对复杂背景以及人体尺度变化、视角变化和运动速度变化时鲁棒性不足。因此,基于骨架的行为识别方法逐渐成为如今的主流算法。
[0003]基于骨架的行为识别方法中,时空图卷积网络将骨架序列数据作为识别模型的输入,在空间上使用图卷积提取特征,然后在时间上使用二维卷积提取特征。但是,人体的行为动作持续时间有长有短,既存在短期的时序关系、也存在一个长时依赖关系,比如扔东西这一行为,短期看仅是手部动作,只有结合长期东西掉落的画面才能对动作进行判断。针对基于骨架序列数据的时空图卷积网络,时序特征的提取采用简单的二维卷积操作,虽然对于骨架序列的短时特征提取效果较好,但是无法有效地解决骨架序列的长时依赖问题。

技术实现思路

[0004]为了解决现有技术中存在的上述问题,本专利技术提供了一种基于时间多尺度自适应特征聚合的骨架行为识别方法及装置。本专利技术要解决的技术问题通过以下技术方案实现:
[0005]第一方面,本专利技术提供一种基于时间多尺度自适应特征聚合的骨架行为识别方法,包括:
[0006]从待处理视频中获取人体的骨架序列数据;
[0007]将所述骨架序列数据输入预先训练好的时空图卷积网络;其中,所述时空图卷积网络包括依次连接的多级时空图卷积层,每级时空图卷积层包括:空间卷积模块、时间卷积模块和多尺度自适应特征聚合模块,所述空间卷积模块的输出端分别与所述时间卷积模块、所述多尺度自适应特征聚合模块的输入端相连;
[0008]根据时间卷积模块输出的时间特征图与多尺度自适应特征聚合模块输出的第一输出特征图,确定每级时空图卷积层的输出特征图,并将所述输出特征图作为下一级时空图卷积层的输入数据;
[0009]根据最后一级时空图卷积层的输出特征图,输出所述骨架序列数据的行为识别结果。
[0010]在本专利技术的一个实施例中,所述多尺度自适应特征聚合模块包括池化层、局部分支和全局分支;
[0011]每级时空图卷积层按照如下步骤对输入数据进行处理:
[0012]利用空间卷积模块提取输入数据的空间特征,获得空间特征图;
[0013]将所述空间特征图分别输入时间卷积模块和多尺度自适应特征聚合模块,以使所述时间卷积模块提取输入数据的时间特征,获得时间特征图,使所述池化层将所述空间特征图在空间上进行压缩,并利用所述局部分支基于压缩后的空间特征图生成时序敏感度图后,根据所述时序敏感度图生成第二输出特征图,并利用所述全局分支基于所述压缩后的空间特征图生成自适应卷积核;
[0014]利用所述自适应卷积核对所述第二输出特征图进行卷积,得到多尺度自适应特征聚合模块的第一输出特征图;
[0015]将所述第一输出特征图与所述时间特征图相加,得到每级时空图卷积层的输出特征图。
[0016]在本专利技术的一个实施例中,所述局部分支包括依次连接的第一卷积层、第一Relu层、第二卷积层、Sigmod层和缩放层,所述全局分支包括依次连接的第一全连接层、第二Relu层、第二全连接层和第一Softmax层。
[0017]在本专利技术的一个实施例中,将所述空间特征图分别输入时间卷积模块和多尺度自适应特征聚合模块,以使所述时间卷积模块提取输入数据的时间特征,获得时间特征图,使所述池化层将所述空间特征图在空间上进行压缩,并利用所述局部分支基于压缩后的空间特征图生成时序敏感度图后,根据所述时序敏感度图生成第二输出特征图,并利用所述全局分支基于所述压缩后的空间特征图生成自适应卷积核的步骤,包括:
[0018]将所述空间特征图分别输入时间卷积模块和多尺度自适应特征聚合模块;
[0019]所述时间卷积模块提取输入数据的时间特征,获得时间特征图;
[0020]所述池化层将所述空间特征图在空间上进行压缩,得到压缩后的空间特征图;
[0021]所述局部分支中第一卷积层对所述压缩后的空间特征图进行一维卷积,获得通道数为C/4的第一特征图,并在由第一Relu层的激励函数Relu处理后输入至第二卷积层,C为所述压缩后的空间特征图的通道数;
[0022]所述第二卷积层将处理后的第一特征图的通道数还原为C,生成时序敏感度图;
[0023]所述Sigmod层对所述时序敏感度图进行处理后,所述缩放层在空间维度上对处理后的时序敏感度图进行复制,并与所述空间特征图进行点积运算,得到所述局部分支的第二输出特征图;
[0024]所述全局分支中第一全连接层将所述压缩后的空间特征图扩展为维度为2T的第二特征图,并在由第二Relu层处理后输入至第二全连接层,T为所述压缩后的空间特征图的时间维度;
[0025]所述第二全连接层将所述第二特征图转换为预设大小C
×
K的第三特征图,并将所述第三特征图输入第一Softmax层后,获得自适应卷积核。
[0026]在本专利技术的一个实施例中,所述时空图卷积网络还包括与所述多级时空图卷积层依次连接的全局平均池化层、第三全连接层和第二Softmax层;
[0027]根据最后一级时空图卷积层的输出特征图,输出所述骨架序列数据的行为识别结果的步骤,包括:
[0028]利用全局平均池化层对最后一级时空图卷积层的输出特征图进行全局平均池化处理,得到输出特征;
[0029]利用所述第三全连接层基于所述输出特征计算每个行为类别的置信度;
[0030]利用第二Softmax层根据所述置信度进行分类,得到所述骨架序列数据的行为识别结果。
[0031]第二方面,本专利技术提供一种基于时间多尺度自适应特征聚合的骨架行为识别装置,包括:
[0032]获取模块,用于从待处理视频中获取人体的骨架序列数据;
[0033]输入模块,用于将所述骨架序列数据输入预先训练好的时空图卷积网络;其中,所述时空图卷积网络包括依次连接的多级时空图卷积层,每级时空图卷积层包括:空间卷积模块、时间卷积模块和多尺度自适应特征聚合模块,所述空间卷积模块的输出端分别与所述时间卷积模块、所述多尺度自适应特征聚合模块的输入端相连;
[0034]确定模块,用于根据时间卷积模块输出的时间特征图与多尺度自适应特征聚合模块输出的第一输出特征图,确定每级时空图卷积层的输出特征图,并将所述输出特征图作为下一级时空图卷积层的输入数据;
[0035]输出模块,用于根据最后一级时空图卷积层的输出特征图,输出所述骨架序列数据的行为识别结果。
[0036]第三方面,本专利技术还提供一种电子设备,包括处理器、通信接本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于时间多尺度自适应特征聚合的骨架行为识别方法,其特征在于,包括:从待处理视频中获取人体的骨架序列数据;将所述骨架序列数据输入预先训练好的时空图卷积网络;其中,所述时空图卷积网络包括依次连接的多级时空图卷积层,每级时空图卷积层包括:空间卷积模块、时间卷积模块和多尺度自适应特征聚合模块,所述空间卷积模块的输出端分别与所述时间卷积模块、所述多尺度自适应特征聚合模块的输入端相连;根据时间卷积模块输出的时间特征图与多尺度自适应特征聚合模块输出的第一输出特征图,确定每级时空图卷积层的输出特征图,并将所述输出特征图作为下一级时空图卷积层的输入数据;根据最后一级时空图卷积层的输出特征图,输出所述骨架序列数据的行为识别结果。2.根据权利要求1所述的基于时间多尺度自适应特征聚合的骨架行为识别方法,其特征在于,所述多尺度自适应特征聚合模块包括池化层、局部分支和全局分支;每级时空图卷积层按照如下步骤对输入数据进行处理:利用空间卷积模块提取输入数据的空间特征,获得空间特征图;将所述空间特征图分别输入时间卷积模块和多尺度自适应特征聚合模块,以使所述时间卷积模块提取输入数据的时间特征,获得时间特征图,使所述池化层将所述空间特征图在空间上进行压缩,并利用所述局部分支基于压缩后的空间特征图生成时序敏感度图后,根据所述时序敏感度图生成第二输出特征图,并利用所述全局分支基于所述压缩后的空间特征图生成自适应卷积核;利用所述自适应卷积核对所述第二输出特征图进行卷积,得到多尺度自适应特征聚合模块的第一输出特征图;将所述第一输出特征图与所述时间特征图相加,得到每级时空图卷积层的输出特征图。3.根据权利要求2所述的基于时间多尺度自适应特征聚合的骨架行为识别方法,其特征在于,所述局部分支包括依次连接的第一卷积层、第一Relu层、第二卷积层、Sigmod层和缩放层,所述全局分支包括依次连接的第一全连接层、第二Relu层、第二全连接层和第一Softmax层。4.根据权利要求3所述的基于时间多尺度自适应特征聚合的骨架行为识别方法,其特征在于,将所述空间特征图分别输入时间卷积模块和多尺度自适应特征聚合模块,以使所述时间卷积模块提取输入数据的时间特征,获得时间特征图,使所述池化层将所述空间特征图在空间上进行压缩,并利用所述局部分支基于压缩后的空间特征图生成时序敏感度图后,根据所述时序敏感度图生成第二输出特征图,并利用所述全局分支基于所述压缩后的空间特征图生成自适应卷积核的步骤,包括:将所述空间特征图分别输入时间卷积模块和多尺度自适应特征聚合模块;所述时间卷积模块提取输入数据的时间特征,获得时间特征图;所述池化层将所述空间特征图在空间上进行压缩,得到压缩后的...

【专利技术属性】
技术研发人员:李佳楠褚华李锐宜程思远
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1