基于深度学习和时序判定法的重复动作计数方法及框架技术

技术编号：37167034 阅读：15 留言：0更新日期：2023-04-20 22:40

本发明专利技术公开了一种基于深度学习和时序判定法的动作计数框架，该框架包括模型检测模块和时序判定模块，所述时序判定模块基于输入的包含特定重复动作的视频段进行判断。该基于深度学习和时序判定法的动作计数框架及构建方法解决了视频理解中对于开始结束信息无法有效预测的问题，提升了预测性能和效率；同时还解决了以往的重复动作计数模型在对于长时间段视频的动作计数预测中，因为采样帧的分布相对于视频长度会过于稀疏而导致的计数值有上限的问题，从而提升了重复动作计数模型的准确度性能。度性能。度性能。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习和时序判定法的重复动作计数方法及框架

[0001]本专利技术属于视频检测
，具体涉及一种基于深度学习和时序判定法的重复动作计数方法及框架。

技术介绍

[0002]实际工业生产环境中，有大量长时间重复操作的工业场景，而对于这些重复动作往往需要人为计数，影响工业生产的效率。现阶段主要通过深度学习模型对视频数据进行处理来解决工业生产场景中长时间的重复动作计数的需求，相关的深度学习模型主要为视频理解模型。现有的视频理解模型包括基于2D卷积神经网络和循环神经网络的CRNN、LSTM等，基于3D卷积神经网络的C3D、I3D等，基于自注意力transformer的TimeSformer、3D
‑
swinTransformer等，视频理解模型可以对视频进行视频分类、时空动作识别、动作计数等。
[0003]现有技术如公布号为CN 114898241 A的中国专利技术专利申请公布了一种基于计算机视觉的视频重复动作计数系统，该专利技术申请采用基于时域自相关的卷积神经网络框架，包括视频特征提取器、时域自相关层、编码器及动作预测器，尽管一定程度上实现了视频中重复动作的检测、定位和计数。但是存在下列不足：(1)无法辨识在实际工业生产过程中，特定重复动作的工序流程的开始、结束信息。对于没有进行特定重复动作的视频片段也会进行检测，从而导致误检发生，降低了模型的预测性能和运行效率；(2)在多尺度的时域帧的采样过程，在长时间段的视频中会导致采样帧的分布过于稀疏，导致重复动作计数值有上限，该上限值受采样帧数影响...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习和时序判定法的重复动作计数方法，其特征在于，包括时序判定模块，以及训练后的目标检测模型和重复动作计数模型，且该方法包括：A.目标检测模型对待检测视频的各视频帧判断动作标志物存在与否；B.时序判定模块基于目标检测模型的判断结果判定是否对待检测视频的视频段执行重复动作行为计数的判定；C.重复动作计数模型对被判定为正在进行重复动作的视频段进行动作次数计数；D.累加基于重复动作计数模型对待检测视频中所有重复动作行为所对应视频段的动作次数计数，累加结果即待检测视频的重复动作次数总和。2.根据权利要求1所述的基于深度学习和时序判定法的重复动作计数方法，其特征在于，每个重复动作行为计数过程包括基于时序判定法所判定是否为开始状态；B中，基于时序判定模块的判定包括是否为开始状态的判定；C中，基于该重复动作的开始状态重复动作计数模型开始对相应视频段进行重复动作计数。3.根据权利要求1所述的基于深度学习和时序判定法的重复动作计数方法，其特征在于，所述A中，目标检测模型判断动作标志物存在与否的方式如下：ojb
t
＝length(f
det
(Img
t
))Img
t
表示待检测视频第t帧所对应的画面；f
det
表示训练后的目标检测模型；length表示数量统计；ojb
t
表示画面Img
t
基于目标检测模型f
det
所预测得到的目标数量；若ojb
t
＞0，则表示目标检测模型的预测结果为画面中有动作标志物，否则，表示目标检测的预测结果为画面中没有动作标志物。4.根据权利要求3所述的基于深度学习和时序判定法的重复动作计数方法，其特征在于，所述时序判定模块判定重复动作行为开始状态如下：当ojb
t
＞0，将Img
t
加入到集合C
obj
中，集合C
obj
表示对预测出有动作标志物的画面进行累计的集合，对集合C
obj
中的元素个数与累计阈值K1进行判断，当length(C
obj
)≥K1时，判定待检测视频在集合C
obj
内的连续K1帧中出现了动作标志物，从而判定为开始状态。5.根据权利要求4所述的基于深度学习和时序判定法的重复动作计数方...

【专利技术属性】
技术研发人员：仇祎诚，牛力，沙枫，廖佳纯，宋文杰，张磊，
申请(专利权)人：南湖实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人