动作识别方法、装置及电子设备制造方法及图纸

技术编号：28131176 阅读：12 留言：0更新日期：2021-04-19 11:53

本发明专利技术实施例提供了一种动作识别方法、装置及电子设备，涉及动作识别技术领域。该方法包括：获取待识别视频中K个图片帧的第一特征；根据所述第一特征对所述待识别视频进行动作识别，得到第一动作识别结果；根据所述第一动作识别结果，获取K个图片帧中M个目标图片帧在所述待识别视频中的目标位置；获取每一所述目标位置前后的N个图片帧的第二特征；将所述第一特征和所述第二特征进行结合，得到第二动作识别结果；其中，M、N、K均为正整数，K大于M。上述方案，不仅可以节省人力，还可以使得动作识别结果更加精确。结果更加精确。结果更加精确。

全部详细技术资料下载

【技术实现步骤摘要】
动作识别方法、装置及电子设备

[0001]本专利技术涉及动作识别
，尤其涉及一种动作识别方法、装置及电子设备。

技术介绍

[0002]目前，短视频产品风靡互联网，短视频内容大量增长，视频审核日趋重要，而视频内容中的动作识别也成为了内容审核中的重要组成部分。短视频动作识别主要有2个步骤：对视频进行解码；对解码后的图片帧根据时序进行动作识别。
[0003]视频解码可以产生大量的图片帧，解码后的图片帧在空间上一般存在严重的冗余，因此在现有的动作识别场景中有以下3种方法降低冗余度：1)基于稀疏采样的图片帧，使用长短期记忆网络(Long Short
‑
Term Memory，LSTM)对按时序顺序输入的图片进行动作可能发生的起止时间的预测；2)从解码后的首帧图片开始，使用LSTM逐渐预测输入网络的下一帧图片的位置，从而达到稀疏采样的目的；3)对视频进行切段，每一段等间隔稀疏或密集采样。
[0004]根据上述方法获取到稀疏采样的图片帧后，输入动作识别模型。业务场景中的动作识别模型需兼顾效率和多样性，现有主流技术采用深度学习卷积模型，主要有以下2种：1)基于光流和LSTM方法进行识别；2)在图片上基于时间和空间的三维(3Dimensions，3D)卷积、空间2D卷积+时序1D卷积组合进行识别。实际业务场景广泛采用效率更高的第2种方法。
[0005]上述短视频动作识别的技术，在审核业务应用中会存在的问题如下：
[0006]第一：LSTM预测动作发生的起止时间时，已经假设整个短视...

【技术保护点】

【技术特征摘要】
1.一种动作识别方法，其特征在于，所述方法包括：获取待识别视频中K个图片帧的第一特征；根据所述第一特征对所述待识别视频进行动作识别，得到第一动作识别结果；根据所述第一动作识别结果，获取K个图片帧中M个目标图片帧在所述待识别视频中的目标位置；获取每一所述目标位置前后的N个图片帧的第二特征；将所述第一特征和所述第二特征进行结合，得到第二动作识别结果；其中，M、N、K均为正整数，K大于M。2.根据权利要求1所述的方法，其特征在于，所述获取待识别视频中K个图片帧的第一特征，包括：获取待识别视频；将所述待识别视频进行视频解码，得到关于所述待识别视频的S个图片帧；从所述S个图片帧中提取K个图片帧进行组合，得到第一图片帧序列；将所述第一图片帧序列经过图像处理，得到K个图片帧的第一特征；其中，S为正整数，且S大于K。3.根据权利要求2所述的方法，其特征在于，所述将所述第一图片帧序列经过图像处理，得到K个图片帧的第一特征，包括：将所述第一图片帧序列进行图像处理中的第一图像卷积处理，得到处理过程中的中间特征图以及处理后的第一特征图；将所述中间特征图进行图像处理中的第二图像卷积处理，得到处理后的第二特征图；将所述第一特征图和所述第二特征图进行拼接处理，得到K个图片帧的第一特征。4.根据权利要求3所述的方法，其特征在于，所述根据所述第一动作识别结果，获取K个图片帧中M个目标图片帧在所述待识别视频中的目标位置，包括：根据所述第一动作识别结果，获取K个图片帧中每一图片帧对应的热力值；根据所述热力值中的M个目标热力值，确定K个图片帧中的M个目标图片帧；获取每一所述目标图片帧在所述待识别视频中的目标位置。5.根据权利要求4所述的方法，其特征在于，所述根据所述第一动作识别结果，获取K个图片帧中每一图片帧对应的热力值，包括：根据所述第一动作识别结果和所述中间特征图，获取K个图片帧中每一图片帧对应的热力图；对每一所述热力图进行池化处理，得到K个图片帧中每一图片帧对应的热力值。6.根据权利要求5所述的方法，其特征在于，所述根据所述第一动作识别结果和所述中间特征图，获取K个图片帧中每一图片帧对应的热力图，包括：根据所述第一动作识别结果以及预设结果，得到所述第一动作...

【专利技术属性】
技术研发人员：李斌泉，
申请(专利权)人：百果园技术新加坡有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人