The invention discloses a method of human video action recognition, a device, a storage medium and a processor. Among them, the method comprises the following steps: according to preset full channel 3D convolution create the first convolutional neural network model; according to the preset action recognition data set to train the first convolutional neural network model, second convolutional neural network model; the at least part of the first convolutional neural network model of the whole channel volume replacement for single channel multilayer three-dimensional 3D convolution unit. Third convolutional neural network model; according to the preset action recognition data sets and second convolutional neural network model training third convolutional neural network model to get the target of convolutional neural network model; input to identify the video to the target convolutional neural network model, target recognition results. The invention solves the technical problems of low calculation precision and poor calculation efficiency existing in the existing technology of human body movement recognition.
【技术实现步骤摘要】
人体视频动作识别方法、装置、存储介质及处理器
本专利技术涉及视频处理领域,具体而言,涉及一种人体视频动作识别方法、装置、存储介质及处理器。
技术介绍
随着社会的信息化、网络化发展浪潮,各种视频大量涌现,如监控系统安防视频、自拍视频、网络媒体视频等。智能的动作分析识别技术对于大规模视频检索、人机交互、安防监控预警、视频分类等应用具有重要作用。传统动作识别借助光流法、密集轨迹分析等技术进行,人工设计并选取特征,计算复杂,且存在性能瓶颈。伴随着深度学习在图像分类领域的突破进展,深度学习相关技术也逐渐渗透至视频分析动作识别领域。但是,目前的人体动作识别方式存在计算精度较低、计算效率较差的技术问题。针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种人体视频动作识别方法、装置、存储介质及处理器,以至少解决现有技术中存在的人体动作识别方式计算精度较低、计算效率较差的技术问题。根据本专利技术实施例的一个方面,提供了一种人体视频动作识别方法,该方法包括:根据预设全通道三维卷积核创建第一卷积神经网络模型;根据预设动作识别数据集训练上述第一卷积神经网络模型,得到第二卷积神经网络模型,其中,上述第二卷积神经网络模型为达到收敛状态的上述第一卷积神经网络模型;将上述第一卷积神经网络模型中的至少部分全通道三维卷积层替换为单通道三维卷积单元,得到第三卷积神经网络模型;根据上述预设动作识别数据集和上述第二卷积神经网络模型训练上述第三卷积神经网络模型,得到目标卷积神经网络模型,其中,上述目标卷积神经网络模型为达到收敛状态的上述第三卷积神经网络模型;输入待识别视 ...
【技术保护点】
一种人体视频动作识别方法,其特征在于,包括:根据预设全通道三维卷积核创建第一卷积神经网络模型;根据预设动作识别数据集训练所述第一卷积神经网络模型,得到第二卷积神经网络模型,其中,所述第二卷积神经网络模型为达到收敛状态的所述第一卷积神经网络模型;将所述第一卷积神经网络模型中的至少部分全通道三维卷积层替换为单通道三维卷积单元,得到第三卷积神经网络模型;根据所述预设动作识别数据集和所述第二卷积神经网络模型训练所述第三卷积神经网络模型,得到目标卷积神经网络模型,其中,所述目标卷积神经网络模型为达到收敛状态的所述第三卷积神经网络模型;输入待识别视频至所述目标卷积神经网络模型,得到目标识别结果。
【技术特征摘要】
1.一种人体视频动作识别方法,其特征在于,包括:根据预设全通道三维卷积核创建第一卷积神经网络模型;根据预设动作识别数据集训练所述第一卷积神经网络模型,得到第二卷积神经网络模型,其中,所述第二卷积神经网络模型为达到收敛状态的所述第一卷积神经网络模型;将所述第一卷积神经网络模型中的至少部分全通道三维卷积层替换为单通道三维卷积单元,得到第三卷积神经网络模型;根据所述预设动作识别数据集和所述第二卷积神经网络模型训练所述第三卷积神经网络模型,得到目标卷积神经网络模型,其中,所述目标卷积神经网络模型为达到收敛状态的所述第三卷积神经网络模型;输入待识别视频至所述目标卷积神经网络模型,得到目标识别结果。2.根据权利要求1所述的方法,其特征在于,在根据预设动作识别数据集训练所述第一卷积神经网络模型之前,所述方法还包括:获取目标视频中的视频数据;将所述视频数据分割成多个视频短片段,其中,每个所述视频短片段仅包含单一动作类别;对所述视频短片段添加预设类别标签,得到所述预设动作识别数据集。3.根据权利要求1所述的方法,其特征在于,所述将所述第一卷积神经网络模型中的至少部分全通道三维卷积层替换为单通道三维卷积单元包括:将所述至少部分全通道三维卷积层替换为所述单通道三维卷积层;在所述单通道三维卷积层的后位层级添加批规范化层、非线性层、残差分支、叠加单元和1x1分组卷积层,得到所述单通道三维卷积单元。4.根据权利要求1所述的方法,其特征在于,所述输入待识别视频至所述目标卷积神经网络模型,得到目标识别结果包括:对所述待识别视频进行分割,得到多个具有同一预设长度的第二视频序列;将多个所述第二视频序列输入至所述目标卷积神经网络,得到所述多个所述第二视频序列对应的初步识别结果;根据预设数据处理方式对所述初步识别结果进行处理,得到所述目标识别结果,其中,所述预设数据处理方式包括下述至少之一:获取所述初步识别结果的极值、获取所述初步识别结果的平均值以及对所述初步识别结果进行加权求和。5.一种人体视频动作识别装置,其特征在于,包括:创建单元,用于根据预设全通道三维卷积核创建第一卷积神经网络模型;第一训练单元,用于根据预设动作识别数据集训练所述第一...
【专利技术属性】
技术研发人员:周文明,王志鹏,
申请(专利权)人:珠海习悦信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。