一种基于改进ResNet与Bi-LSTM的行为识别方法技术

技术编号：29049326 阅读：17 留言：0更新日期：2021-06-26 06:10

本发明专利技术属于应用图像行为识别技术领域，具体涉及一种基于改进ResNet与Bi

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进ResNet与Bi
‑
LSTM的行为识别方法

[0001]本专利技术属于应用图像行为识别
，具体涉及一种基于改进ResNet与Bi
‑
LSTM的行为识别方法。

技术介绍

[0002]目前传统行为识别方法依赖人工特征工程,对于复杂条件下的数据如遮挡、背景杂乱、阴影光照差异等环境因素都会给图像特征提取带来困难,且二维图像数据处理方法无法很好的对3D数据进行有效的联合识别,导致识别效果较差。
[0003]存在问题或缺陷的原因：目前现有方式依赖人工对特征进行选取，智能化程度低，且方法的泛化性能及鲁棒性较弱，无法对3D数据进行有效分析，识别效果较差。

技术实现思路

[0004]针对上述方法传统行为识别方法智能化程度低、方法的泛化性能及鲁棒性较弱等问题，本专利技术提供了一种更好的对数据特征进行提取，对人体行为进行更好识别的方法。
[0005]为了解决上述技术问题，本专利技术采用的技术方案为：
[0006]一种基于改进ResNet与Bi
‑
LSTM的行为识别方法，包括下列步骤：
[0007]S100、标签处理：对UTKinectAction3D数据集的标签：走路、坐下、站起、捡起、抬起、扔、推、拉、挥手和拍手十类数据进行One
‑
Hot格式转换；
[0008]S200、数据预处理：对数据集分为训练集、验证集与训练集三部分；
[0009]S300、模型构建：将网络分为5个ResNe...

【技术保护点】

【技术特征摘要】
1.一种基于改进ResNet与Bi
‑
LSTM的行为识别方法，其特征在于：包括下列步骤：S100、标签处理：对UTKinectAction3D数据集的标签：走路、坐下、站起、捡起、抬起、扔、推、拉、挥手和拍手十类数据进行One
‑
Hot格式转换；S200、数据预处理：对数据集分为训练集、验证集与训练集三部分；S300、模型构建：将网络分为5个ResNet1模块、Bi
‑
LSTM网络、ResNet2模块、全连接网络四个部分；S400、网络训练：对搭建好的网络使用训练集进行训练，完成参数模型的训练；S500、网络验证：证验证网络损失值不再下降；S600、模型评价：使用训练好的网络对测试集数据进行识别，计算准确率与召回率对网络识别效果进行评价。2.根据权利要求1所述的一种基于改进ResNet与Bi
‑
LSTM的行为识别方法，其特征在于：所述S100标签处理中，将其下标index分别为0
‑
9，对数据标签进行转换。3.根据权利要求2所述的一种基于改进ResNet与Bi
‑
LSTM的行为识别方法，其特征在于：所述S200数据预处理中，将人体20个关节、持续120帧的三通道数据以7：1：2的比例划分为数据训练集、验证集与测试集。4.根据权利要求3所述的一种基于改进ResNet与Bi
‑
LSTM的行为识别方法，其特征在于：所述S300模型构建中，采用卷积层
‑
Average池化层
‑
BatchNormalization层
‑
激活层
‑
卷积层
‑
Max池化层
‑
BatchNormalization层
‑
激活层顺序组合方式组合5个包含两个卷积层、两个池化层、两个BatchNormalization层与两个激活层构成的ResNet模块构成ResNet1层。5.根据权利要求4所述的一种基于改进ResNet与Bi
‑
L...

【专利技术属性】
技术研发人员：潘晓光，焦璐璐，董虎弟，韩丹，马文芳，
申请(专利权)人：山西三友和智慧信息技术股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人