视频行为识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号：33080557 阅读：44 留言：0更新日期：2022-04-15 10:33

本申请涉及一种视频行为识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：从至少两帧目标视频图像提取视频图像特征；将视频图像特征的空间特征进行贡献调整，得到中间图像特征；基于先验信息对中间图像特征的时间特征和时间特征对应的内聚特征进行融合，得到融合特征；先验信息是根据中间图像特征在时间维度的变化信息得到的；内聚特征是对时间特征进行关注处理得到的；对融合特征进行时间特征贡献调整，得到行为识别特征；基于行为识别特征进行视频行为识别。采用本方法能够提高视频行为识别的准确率。法能够提高视频行为识别的准确率。法能够提高视频行为识别的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
视频行为识别方法、装置、计算机设备和存储介质

[0001]本申请涉及计算机
，特别是涉及一种视频行为识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着计算机技术的发展，计算机视觉技术在工业、安保、医疗、社交、导航和军事等各领域得到了广泛的应用，通过计算机视觉，可以用计算机代替人眼对目标进行识别、跟踪和测量等视觉感知处理，实现对生物视觉的模拟。视频行为识别是计算机视觉领域的重要课题之一，基于视频行为识别可以识别出给定视频出目标对象的动作行为，如吃饭、跑步、说话等各种动作行为。
[0003]目前，视频行为识别处理中，多是通过从视频中提取特征以进行行为识别，但传统的视频行为识别处理中提取的特征无法有效反映出视频中的行为信息，导致视频行为识别的准确率较低。

技术实现思路

[0004]基于此，有必要针对上述技术问题，提供一种能够提高视频行为识别准确率的视频行为识别方法、装置、计算机设备、存储介质和计算机程序产品。
[0005]一种视频行为识别方法，所述方法包括：
[0006]从至少两帧目标视频图像提取视频图像特征；
[0007]将视频图像特征的空间特征进行贡献调整，得到中间图像特征；
[0008]基于先验信息对中间图像特征的时间特征和时间特征对应的内聚特征进行融合，得到融合特征；先验信息是根据中间图像特征在时间维度的变化信息得到的；内聚特征是对时间特征进行关注处理得到的；
[0009]对融合特征进行时间特征贡献调整，得到行为识...

【技术保护点】

【技术特征摘要】
1.一种视频行为识别方法，其特征在于，所述方法包括：从至少两帧目标视频图像提取视频图像特征；将所述视频图像特征的空间特征进行贡献调整，得到中间图像特征；基于先验信息对所述中间图像特征的时间特征和所述时间特征对应的内聚特征进行融合，得到融合特征；所述先验信息是根据所述中间图像特征在时间维度的变化信息得到的；所述内聚特征是对所述时间特征进行关注处理得到的；对所述融合特征进行时间特征贡献调整，得到行为识别特征；基于所述行为识别特征进行视频行为识别。2.根据权利要求1所述的方法，其特征在于，所述将所述视频图像特征的空间特征进行贡献调整，得到中间图像特征，包括：将所述视频图像特征进行空间特征提取，得到所述视频图像特征的空间特征；通过结构参数中的空间结构参数对所述空间特征进行贡献调整，得到中间图像特征；所述结构参数是通过携带行为标签的视频图像样本训练得到的；所述对所述融合特征进行时间特征贡献调整，得到行为识别特征，包括：通过所述结构参数中的时间结构参数对所述融合特征进行贡献调整，得到行为识别特征。3.根据权利要求2所述的方法，其特征在于，所述方法还包括：确定待训练结构参数；通过所述待训练结构参数中的空间结构参数，对视频图像样本特征的空间样本特征进行贡献调整，得到中间样本特征；所述视频图像样本特征是从所述视频图像样本提取得到的；基于先验样本信息对所述中间样本特征的时间样本特征和所述时间样本特征对应的内聚样本特征进行融合，得到融合样本特征；所述内聚样本特征是对所述时间样本特征进行关注处理得到的；所述先验样本信息是根据所述中间样本特征在时间维度的变化信息得到的；通过所述待训练结构参数中的时间结构参数对所述融合样本特征进行贡献调整，得到行为识别样本特征；基于所述行为识别样本特征进行视频行为识别，并根据行为识别结果和所述视频图像样本对应的行为标签，对所述待训练结构参数进行更新后继续训练直至训练结束，获得所述结构参数。4.根据权利要求3所述的方法，其特征在于，所述方法通过视频行为识别模型实现，所述待训练结构参数是所述视频行为识别模型在训练中的参数；所述根据行为识别结果和所述视频图像样本对应的行为标签，对所述待训练结构参数进行更新后继续训练直至训练结束，获得所述结构参数，包括：获得所述视频行为识别模型输出的行为识别结果；确定所述行为识别结果与所述视频图像样本对应的行为标签之间的差异；根据所述差异对所述视频行为识别模型中的模型参数和所述待训练结构参数进行更新；基于更新后的视频行为识别模型继续训练直至训练结束，并根据训练完成的视频行为
识别模型得到所述结构参数。5.根据权利要求3所述的方法，其特征在于，所述根据行为识别结果和所述视频图像样本对应的行为标签，对所述待训练结构参数进行更新后继续训练直至训练结束，获得所述结构参数，包括：确定行为识别结果和所述视频图像样本对应的行为标签之间的行为识别损失；根据所述行为识别损失和前一行为识别损失得到奖励值；根据所述奖励值对所述待训练结构参数进行更新，通过更新后的待训练结构参数继续训练直至目标函数满足结束条件时，获得所述结构参数；所述目标函数基于训练过程中的各奖励值得到。6.根据权利要求5所述的方法，其特征在于，所述根据所述奖励值对所述待训练结构参数进行更新，包括：根据所述奖励值对策略梯度网络模型的模型参数进行更新；由更新后的策略梯度网络模型对所述待训练结构参数进行更新。7.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定所述中间图像特...

【专利技术属性】
技术研发人员：胡益珲，杨伟东，陈宇，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人