基于多尺度特征的人类动作识别方法及系统技术方案

技术编号：34135512 阅读：28 留言：0更新日期：2022-07-14 16:30

本发明专利技术提出了基于多尺度特征的人类动作识别方法及系统，包括：利用卷积网络获取视频序列的空间特征；针对空间特征在时间维度上取局部窗口，在局部窗口内进行计算获取基于初级局部特征的最大响应；对基于初级局部特征的最大响应进行处理获得次级特征；对于次级特征在时间维度上取局部窗口，在局部窗口内进行计算获取基于次级局部特征的最大响应；对于基于初级局部特征的最大响应及基于次级局部特征的最大响应过加权融合的方式获得最终动作分类，所获得的特征对应着视频序列的短期、中期、长期特征。本发明专利技术对于时间序列进行短期和长期建模，提升动作识别算法性能。提升动作识别算法性能。提升动作识别算法性能。

Human motion recognition method and system based on multi-scale features

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度特征的人类动作识别方法及系统

[0001]本专利技术属于图像处理
，尤其涉及基于多尺度特征的人类动作识别方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息，不必然构成在先技术。
[0003]动作识别任务作为计算机视觉在现实生活中的主要应用之一，在现实生活中有着广泛的应用，轻量化的动作识别算法可以部署在边缘设备，将动作识别算法应用到工厂、街道等现实场景进行视频监督、行为预测已经成为新的研究热点，同时也带来了很大的挑战。动作识别旨在通过短时间内的少量视频帧，识别被观察者进行的动作类别。常规环境下的动作识别算法研究已经取得很大进展，但由于部署环境的多样性以及训练数据稀缺，算法需要在不同的应用场景能够保证较高的识别精度。
[0004]对于常规动作识别任务，传统方法主要包括基于RGB图像和基于人体关节点序列两个主流方向，相比于基于RGB图像序列的方法，基于图卷积网络(GCN)对人体骨架建模的方法对复杂背景的变化等干扰因素具有很强的鲁棒性。而且与视频流的处理相比，处理关节点数据消耗的计算资源更少，模型的训练周期也相对较短。虽然基于深度学习的传统动作识别算法已经取得了很大的进展，但动作识别任务的特殊性对算法精度提出了更高的要求。
[0005]动作识别不同于一般的图像分类任务，它需要在序列中提取帧之间的时空信息，同时需要从空间中定位出响应较高的人的部位。同时，视频中存在复杂的背景、遮挡等干扰因素。人类的动作类别存在着种类之间的差异性，同时也存在同一类别不...

【技术保护点】

【技术特征摘要】
1.基于多尺度特征的人类动作识别方法，其特征是，包括：利用卷积网络获取视频序列的空间特征；针对空间特征在时间维度上取局部窗口，在局部窗口内进行计算获取基于初级局部特征的最大响应；对基于初级局部特征的最大响应进行处理获得次级特征；对于次级特征在时间维度上取局部窗口，在局部窗口内进行计算获取基于次级局部特征的最大响应；对于基于初级局部特征的最大响应及基于次级局部特征的最大响应过加权融合的方式获得最终动作分类，所获得的特征对应着视频序列的短期、中期、长期特征。2.如权利要求1所述的基于多尺度特征的人类动作识别方法，其特征是，利用卷积网络获取视频序列的空间特征，具体为：对于含有T帧的视频序列，通过2D卷积神经网络对每一帧进行特征提取，获得T
×
HW维度的特征表示。3.如权利要求1所述的基于多尺度特征的人类动作识别方法，其特征是，对于基于初级局部特征的最大响应进行移位操作，并进行self
‑
attention计算，以扩大模型感受野。4.如权利要求1所述的基于多尺度特征的人类动作识别方法，其特征是，利用第一层Swin Transformer单元对移位操作后的特征进行处理，生成的次级特征，对次级特征进行局部的特征融合，融合比例为N，则生成大小为T/N
×
HW维度特征。5.如权利要求1所述的基于多尺度特征的人类动作识别方法，其特征是，对于次级特征，进行移位操作，并进行self
‑
attention计算，以扩大模型感受野。6.如权利要求1所述的基于多尺度特征的人类动作识别方法，其特征是，利用第二层Swin...

【专利技术属性】
技术研发人员：焦敏，亓振亮，谭冲，张伟，李晓磊，亓鹏，陈顺东，崔建，丁利朝，何鹏，王洪瑞，张文利，
申请(专利权)人：国家电网有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人