当前位置: 首页 > 专利查询>鲁东大学专利>正文

人体行为识别方法及装置制造方法及图纸

技术编号:21570628 阅读:34 留言:0更新日期:2019-07-10 15:11
本发明专利技术实施例提供一种人体行为识别方法及装置,其中方法包括:提供图形用户界面GUI,GUI用于展示控制面板和显示面板,控制面板中包括加载网络按钮、加载图像按钮以及识别按钮,显示面板用于显示待识别的图像和行为识别结果;若监测到触发加载网络按钮,则加载预先训练的GoogLeNet模型;若在加载GoogLeNet模型后,监测到触发加载图像按钮,则在接收到待识别的图像后,将图像显示在显示面板中;若图像显示在显示面板后,监测到触发识别按钮,则将待识别的图像输入至GoogLeNet模型,输出行为识别结果,将行为识别结果显示在显示面板中。本发明专利技术实施例构建GUI能够更直观地展示人体行为识别的过程,并且在应用时只需加载一次模型即可实现重复识别的目的。

Human Behavior Recognition Method and Device

【技术实现步骤摘要】
人体行为识别方法及装置
本专利技术实施例涉及图像识别
,更具体地,涉及一种人体行为识别方法及装置。
技术介绍
近年来,人类行为识别逐渐成为一个非常活跃的研究课题。由于动作的复杂性,例如不同的身体磨损和习惯导致了对同一动作的不同观察,在外部环境下的相机运动,光照变化,阴影,视点,这些因素的影响使得动作识别仍然是一个具有挑战性的项目。行为分析中大部分研究都是基于视频的,而静态图像的研究相对较少。但近年来,有关静态图像的人体行为识别研究也慢慢得到了关注。现有技术中存在一种“poselet激活向量”的方法,参见参考文献:《Actionrecognitionfromadistributedrepresentationofposeandappearance》,该方法对人的姿势和外观实现分布式表示,对于遮挡、视角变化有较好的鲁棒性,但因为缺乏人与物体之间的姿态约束而不能很好地估计体态,进行识别。现有技术中还存在一种方法,参见参考文献:《Poseprimitivebasedhumanactionrecognitioninvideosorstillimages》该方法将人体动作的图像分为行为部分和背景部分各自进行训练,使其得到不同的行为原型表达,再根据测试图像与行为原型的接近程度判断行为类别。此方法简单,不需要考虑人体检测、物体检测等问题,但也因为无法区分不同行为之间的细微差距和人与场景、物体之间的交互关系而使识别准确率较低。
技术实现思路
本专利技术实施例提供一种克服上述问题或者至少部分地解决上述问题的人体行为识别方法及装置。第一个方面,本专利技术实施例提供一种人体行为识别方法,包括:提供图形用户界面GUI,所述GUI用于展示控制面板和显示面板,所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮,所述显示面板用于显示待识别的图像和行为识别结果;若监测到触发所述加载网络按钮,则加载预先训练的GoogLeNet模型;若在加载所述GoogLeNet模型后,监测到触发所述加载图像按钮,则在接收到待识别的图像后,将所述图像显示在所述显示面板中;若所述图像显示在所述显示面板后,监测到触发所述识别按钮,则将所述待识别的图像输入至所述GoogLeNet模型,输出行为识别结果,将所述行为识别结果显示在所述显示面板中;其中,所述GoogLeNet模型通过样本图像以及所述样本图像的行为标签训练而成。第二个方面,本专利技术实施例提供一种人体行为识别装置,包括:GUI模块,用于提供图形用户界面GUI,所述GUI用于展示控制面板和显示面板,所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮,所述显示面板用于显示待识别的图像和行为识别结果;图像加载模块,用于若监测到触发所述加载网络按钮,则加载预先训练的GoogLeNet模型;若在加载所述GoogLeNet模型后,监测到触发所述加载图像按钮,则在接收到待识别的图像后,将所述图像显示在所述显示面板中;输出模块,用于若所述图像显示在所述显示面板后,监测到触发所述识别按钮,则将所述待识别的图像输入至所述GoogLeNet模型,输出行为识别结果,将所述行为识别结果显示在所述显示面板中;其中,所述GoogLeNet模型通过样本图像以及所述样本图像的行为标签训练而成。第三方面,本专利技术实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所提供的方法的步骤。第四方面,本专利技术实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所提供的方法的步骤。本专利技术实施例提供的人体行为识别方法及装置,通过使用2014年ILSVRC挑战赛中取得冠军的GoogLeNet模型构建基于GoogLeNet人体行为识别模型,以实现对人体动作的分类目标。构建GUI能够更直观地展示人体行为识别的过程,并且在应用时只需加载一次模型即可实现重复识别的目的。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的人体行为识别方法的流程示意图;图2为本专利技术实施例提供的人体行为识别装置的结构示意图;图3为本专利技术实施例提供的电子设备的实体结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。图1为本专利技术实施例提供的人体行为识别方法的流程示意图,如图1所示,该方法包括S101、S102和S103,具体地,S101、提供图形用户界面GUI,所述GUI用于展示控制面板和显示面板,所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮,所述显示面板用于显示待识别的图像和行为识别结果。本专利技术实施例的人体行为识别方法的一个目的在于实现识别过程的可视化,因此,本专利技术实施例提供图形用户界面(GraphicalUserInterface,GUI),用于展示人体行为识别过程的必要信息,在本专利技术实施例中,GUI用于展示控制面板和显示面板,控制面板包括加载网络按钮、加载图像按钮以及识别按钮,加载网络按钮被配置为触发后加载预先训练好的神经网络,本专利技术实施例的人体行为识别通过神经网络的方式实现。加载图像按钮被配置为触发后加载待识别的图像。识别按钮被配置为触发后利用已加载的神经网络识别图像。显示面板则用于显示待识别的图像和行为识别结果,当加载图像按钮被触发后,显示面板会显示待识别的图像供使用者观看,当识别按钮被触发后,显示面板会进一步显示出图像中的行为识别结果。S102、若监测到触发所述加载网络按钮,则加载预先训练的GoogLeNet模型;若在加载所述GoogLeNet模型后,监测到触发所述加载图像按钮,则在接收到待识别的图像后,将所述图像显示在所述显示面板中。需要说明的是,本专利技术实施例的神经网络模型为GoogLeNet模型。GoogLeNet是一种通过加深网络模型深度和宽度来构建的一种深度卷积神经网络。如果在加深网络时只是纯粹增大网络,就会出现过拟合和计算量增加的问题,为解决上述问题就要在增加网络深度和宽度的同时减少参数,因此卷积神经网络中的全连接就需要变成稀疏连接。因此GoogLeNet模型采用既能达到稀疏的减少参数的效果,又能利用硬件中密集矩阵优化的Inception网络架构。Inception模型的主要优势在于可以显著增加每个阶段的单元数量,而不会无限的提高计算复杂性。加入Inception模型的GoogLeNet神经网络可以实现图像处理的有效降维,增加网络模型的深度与宽度。S103、若所述图像显示在所述显示面板后,监测到触发所述识别按钮,则将所述待识别的图像输入至所述GoogLeNet模型,输出行为识别结果,将所述行为识别结果显示在所述显示面板本文档来自技高网...

【技术保护点】
1.一种人体行为识别方法,其特征在于,包括:提供图形用户界面GUI,所述GUI用于展示控制面板和显示面板,所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮,所述显示面板用于显示待识别的图像和行为识别结果;若监测到触发所述加载网络按钮,则加载预先训练的GoogLeNet模型;若在加载所述GoogLeNet模型后,监测到触发所述加载图像按钮,则在接收到待识别的图像后,将所述图像显示在所述显示面板中;若所述图像显示在所述显示面板后,监测到触发所述识别按钮,则将所述待识别的图像输入至所述GoogLeNet模型,输出行为识别结果,将所述行为识别结果显示在所述显示面板中;其中,所述GoogLeNet模型通过样本图像以及所述样本图像的行为标签训练而成。

【技术特征摘要】
1.一种人体行为识别方法,其特征在于,包括:提供图形用户界面GUI,所述GUI用于展示控制面板和显示面板,所述控制面板中包括加载网络按钮、加载图像按钮以及识别按钮,所述显示面板用于显示待识别的图像和行为识别结果;若监测到触发所述加载网络按钮,则加载预先训练的GoogLeNet模型;若在加载所述GoogLeNet模型后,监测到触发所述加载图像按钮,则在接收到待识别的图像后,将所述图像显示在所述显示面板中;若所述图像显示在所述显示面板后,监测到触发所述识别按钮,则将所述待识别的图像输入至所述GoogLeNet模型,输出行为识别结果,将所述行为识别结果显示在所述显示面板中;其中,所述GoogLeNet模型通过样本图像以及所述样本图像的行为标签训练而成。2.根据权利要求1所述的方法,其特征在于,所述GoogLeNet模型中的Softmax分类层的维度为1*1*n,n表示行为识别结果的种类;所述Softmax分类层之后还连接分类输出层,所述分类输出层用于输入大小为1*1*n的特征图,输出行为识别结果。3.根据权利要求2所述的方法,其特征在于,所述GoogLeNet模型还包括:第一卷积层,用于输入为224*224像素的待识别的图像,输出大小为112*112*64的第一特征图;第一池化层,用于输入所述第一特征图,输出大小为56*56*64的第二特征图;第二卷积层,用于输入所述第二特征图,输出大小为56*56*192的第三特征图;第二池化层,用于输入所述第三特征图,输出大小为28*28*192的第四特征图;第一inception模块,用于输入所述第四特征图,输出大小为28*28*480的第五特征图;第三池化层,用于输入所述第五特征图,输出大小为14*14*480的第六特征图;第二inception模块,用于输入所述第六特征图,输出大小为14*14*832的第七特征图;...

【专利技术属性】
技术研发人员:岳峻魏丽冉贾世祥李振波张志旺寇光杰姚涛
申请(专利权)人:鲁东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1