人体行为识别方法及装置制造方法及图纸

技术编号：21570628 阅读：34 留言：0更新日期：2019-07-10 15:11

本发明专利技术实施例提供一种人体行为识别方法及装置，其中方法包括：提供图形用户界面GUI，GUI用于展示控制面板和显示面板，控制面板中包括加载网络按钮、加载图像按钮以及识别按钮，显示面板用于显示待识别的图像和行为识别结果；若监测到触发加载网络按钮，则加载预先训练的GoogLeNet模型；若在加载GoogLeNet模型后，监测到触发加载图像按钮，则在接收到待识别的图像后，将图像显示在显示面板中；若图像显示在显示面板后，监测到触发识别按钮，则将待识别的图像输入至GoogLeNet模型，输出行为识别结果，将行为识别结果显示在显示面板中。本发明专利技术实施例构建GUI能够更直观地展示人体行为识别的过程，并且在应用时只需加载一次模型即可实现重复识别的目的。

Human Behavior Recognition Method and Device

全部详细技术资料下载

【技术实现步骤摘要】
人体行为识别方法及装置
本专利技术实施例涉及图像识别
，更具体地，涉及一种人体行为识别方法及装置。
技术介绍
近年来，人类行为识别逐渐成为一个非常活跃的研究课题。由于动作的复杂性，例如不同的身体磨损和习惯导致了对同一动作的不同观察，在外部环境下的相机运动，光照变化，阴影，视点，这些因素的影响使得动作识别仍然是一个具有挑战性的项目。行为分析中大部分研究都是基于视频的，而静态图像的研究相对较少。但近年来，有关静态图像的人体行为识别研究也慢慢得到了关注。现有技术中存在一种“poselet激活向量”的方法，参见参考文献：《Actionrecognitionfromadistributedrepresentationofposeandappearance》，该方法对人的姿势和外观实现分布式表示，对于遮挡、视角变化有较好的鲁棒性，但因为缺乏人与物体之间的姿态约束而不能很好地估计体态，进行识别。现有技术中还存在一种方法，参见参考文献：《Poseprimitivebasedhumanactionrecognitioninvideosorstillimages》该方法将人体动作的图像分为行为部分和背景部分各自进行训练，使其得到不同的行为原型表达，再根据测试图像与行为原型的接近程度判断行为类别。此方法简单，不需要考虑人体检测、物体检测等问题，但也因为无法区分不同行为之间的细微差距和人与场景、物体之间的交互关系而使识别准确率较低。
技术实现思路
本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的人体行为识别方法及装置。第一个方面，本专利技术实施例提供一种人体行为...

【技术保护点】
1.一种人体行为识别方法，其特征在于，包括：提供图形用户界面GUI，所述GUI用于展示控制面板和显示面板，所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮，所述显示面板用于显示待识别的图像和行为识别结果；若监测到触发所述加载网络按钮，则加载预先训练的GoogLeNet模型；若在加载所述GoogLeNet模型后，监测到触发所述加载图像按钮，则在接收到待识别的图像后，将所述图像显示在所述显示面板中；若所述图像显示在所述显示面板后，监测到触发所述识别按钮，则将所述待识别的图像输入至所述GoogLeNet模型，输出行为识别结果，将所述行为识别结果显示在所述显示面板中；其中，所述GoogLeNet模型通过样本图像以及所述样本图像的行为标签训练而成。

【技术特征摘要】
1.一种人体行为识别方法，其特征在于，包括：提供图形用户界面GUI，所述GUI用于展示控制面板和显示面板，所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮，所述显示面板用于显示待识别的图像和行为识别结果；若监测到触发所述加载网络按钮，则加载预先训练的GoogLeNet模型；若在加载所述GoogLeNet模型后，监测到触发所述加载图像按钮，则在接收到待识别的图像后，将所述图像显示在所述显示面板中；若所述图像显示在所述显示面板后，监测到触发所述识别按钮，则将所述待识别的图像输入至所述GoogLeNet模型，输出行为识别结果，将所述行为识别结果显示在所述显示面板中；其中，所述GoogLeNet模型通过样本图像以及所述样本图像的行为标签训练而成。2.根据权利要求1所述的方法，其特征在于，所述GoogLeNet模型中的Softmax分类层的维度为1*1*n，n表示行为识别结果的种类；所述Softmax分类层之后还连接分类输出层，所述分类输出层用于输入大小为1*1*n的特征图，输出行为识别结果。3.根据权利要求2所述的方法，其特征在于，所述GoogLeNet模型还包括：第一卷积层，用于输入为224*224像素的待识别的图像，输出大小为112*112*64的第一特征图；第一池化层，用于输入所述第一特征图，输出大小为56*56*64的第二特征图；第二卷积层，用于输入所述第二特征图，输出大小为56*56*192的第三特征图；第二池化层，用于输入所述第三特征图，输出大小为28*28*192的第四特征图；第一inception模块，用于输入所述第四特征图，输出大小为28*28*480的第五特征图；第三池化层，用于输入所述第五特征图，输出大小为14*14*480的第六特征图；第二inception模块，用于输入所述第六特征图，输出大小为14*14*832的第七特征图；...

【专利技术属性】
技术研发人员：岳峻，魏丽冉，贾世祥，李振波，张志旺，寇光杰，姚涛，
申请(专利权)人：鲁东大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人