The invention discloses a method of human motion recognition based on hierarchical information transmission, which includes the following steps: S1, dividing human body into a hierarchical structure, which is composed of local body regions with finer and finer granularity from top to bottom, i.e., dividing human body into smaller body parts recursively; S2, Constructing Hierarchical Communication network, recursively dividing human body into middle layers. The information of sub-structure is transferred and integrated to get the final action descriptor; S3, the action descriptor obtained by E 2 is combined with the additional full graph information, and the final full connection layer is input for classification. The probability distribution of the confidence is calculated by sigmoid function, and the classification loss is calculated by binary cross-entropy. The invention defines an abstract human body segmentation framework and rules, which makes the selection of human body segmentation scheme more flexible and reduces the singularity or irrationality.
【技术实现步骤摘要】
基于层次信息传递的图片人体动作识别方法
本专利技术属于计算机视觉
,具体涉及一种基于层次信息传递的图片人体动作识别方法。
技术介绍
图像动作识别是计算机视觉领域的一项基础且重要的研究,它要求模型识别图像中人体所进行的动作并给出动作的类别。图像动作识别有很多方面的应用,例如图像说明(ImageCaption)、群体行为识别(collectiveactivityrecognition)及人家人物交互识别(Human-objectInteraction)等等。图像动作识别也是视频动作分析的基础,通过将视频帧视为单个图像,可以将问题转化为图像的动作识别,从而在时间维度上进一步建模。已有的工作主要可以分为三类:基于人体姿态的图像动作识别、基于层次结构的图像动作识别以及基于物体检测的图像动作识别。1)基于人体姿态的图像动作识别:这一类方法的主要思路是捕捉图像中人体的姿态信息并进行编码,因为人体姿态常常隐含着大量动作的线索。Mallya在LearningModelsforActionsandPerson-objectInteractionswithTransfertoQuestionAnswering中利用深度卷积神经网络提取图像的特征矩阵,接着使用人体姿势估计(poseestimator)检测人体在图像中的边界框(boundingbox)。人体姿势估计算法用于检测人体关键点(例如某些关节点)在图像中的坐标位置,利用这些坐标位置即可计算出人体在图像中的边界框;若无特别提及,下文提到的人体姿势估计算法都是利用别人提供且训练好的模型。得到人体在图像上的边界框后,通过区 ...
【技术保护点】
1.一种基于层次信息传递的图片人体动作识别方法,其特征在于,包括下述步骤:S1、将人体分割为一个层次结构,该层次结构是自顶向下由粒度越来越细的局部身体区域构成,即将人体递归地分解为更小的身体部分;围绕这些身体部分,从图像中截取对应区域,利用卷积神经网络提取图像特征;S2、构建层次传播网络,递归地对步骤S1中层次结构的特征信息进行传递与整合,从而得到最终的动作描述子;S3、将步骤S2得到的动作描述子与额外的全图信息结合,输入最后的全连接层进行分类。
【技术特征摘要】
1.一种基于层次信息传递的图片人体动作识别方法,其特征在于,包括下述步骤:S1、将人体分割为一个层次结构,该层次结构是自顶向下由粒度越来越细的局部身体区域构成,即将人体递归地分解为更小的身体部分;围绕这些身体部分,从图像中截取对应区域,利用卷积神经网络提取图像特征;S2、构建层次传播网络,递归地对步骤S1中层次结构的特征信息进行传递与整合,从而得到最终的动作描述子;S3、将步骤S2得到的动作描述子与额外的全图信息结合,输入最后的全连接层进行分类。2.根据权利要求1所述基于层次信息传递的图片人体动作识别方法,其特征在于,所述步骤S1具体为:将该人体层次分割标记为A={Hi},i=1,2,...,I,I是该人体层次分割的总层数,Hi表示第i层里身体部分的集合;由此可见,H1包含最大的身体部分,因此也是层次人体分割A的根结点;Hi里的每个节点可被分解为更小的部分,由此构成Hi+1里的结点;因此HI包含最小的身体部分。3.根据权利要求2所述基于层次信息传递的图片人体动作识别方法,其特征在于,步骤S2具体为:HI中结点的信息传递到HI-1中对应的父节点,形成位于该父节点位置的集成信息,这些集成信息又被传递至HI-2中对应的父节点上,在这种递归模式下,底层的信息最终被传播并集成到H1的根结点上,形成最终的动作描述子。4.根据权利要求3所述基于层次信息传递的图片人体动作识别方法,其特征在于,将Hi里的第j个结点标记为xij,将传递并集成于xij的信...
【专利技术属性】
技术研发人员:胡建芳,朱海昇,谢佳锋,郑伟诗,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。