一种用于动作的时间轴定位的回归分类模块和方法技术

技术编号：25309505 阅读：38 留言：0更新日期：2020-08-18 22:28

一种用于动作的时间轴定位的回归分类模块，包括：回归器，用于根据最初的动作的特征计算出回归后的动作位置，其中，动作的特征是指由特征提取器学习到的视频特征；池化层，用于根据整段视频特征以及回归后的动作位置为输入，输出回归后的动作特征；以及分类器，用于使用回归后的动作特征预测出对应于回归后位置的动作类别，其中，回归器位于分类器前。本发明专利技术的回归分类模块首次将回归器放置于分类器前，从而消除了并行的分类器与回归器所带来的最终预测结果中动作类别与位置不相符的问题。本发明专利技术同时也设计了新的分类损失函数，使用经过回归器回归后的位置来计算分类损失函数中的分类目标标签。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于动作的时间轴定位的回归分类模块和方法
本专利技术涉及视频分析
，尤其是一种用于动作的时间轴定位的回归分类模块和方法。
技术介绍
动作的时间轴定位是指检测出视频中特定动作在时间上的位置以及其类别，目前这项技术主要借助深度神经网络来实现。动作的时间轴定位以视频作为输入，以预测出的视频中包含的特定动作的时间位置及类别作为输出。其一般步骤包括：1、提取出视频的特征；2、根据视频特征预测出初步的动作实例；3、根据初步的动作实例位置以及整个视频的特征计算出其对应的动作特征，并进一步预测出动作实例更精确的位置以及其类别。在大多数动作的时间轴定位模型中，步骤1一般由传统的时空特征提取器(比如I3DNetwork)来完成；步骤2则可分为单阶段和双阶段两种：单阶段一般采用设定好的不同位置和比例的框作为初步的动作实例，双阶段则采用一些经典算法(比如卷积神经网络)来生成初步的动作实例；步骤3一般使用初步动作的特征分别输入到并行的分类器和回归器中。但是并行的分类器和回归器会带来一个问题：回归器产生了新的动作位置，但是与此同时分类器所预测的类别确是针对初步的动作位置的。这样就导致了最终结果中动作的位置与类别不对应。另外，这种以为神经网络为基础的模型一般都包含训练和测试两个部分。设计好的模型通过训练得到合适的参数，并将训练得到的最终结果用于测试即检测视频中的动作。值得一提的是，在训练的过程中，大部分动作的时间轴定位模型会固定特征提取部分的权重来节省时间和空间的开销。
技术实现思路
...

【技术保护点】
1.一种用于动作的时间轴定位的回归分类模块，其特征在于，包括：/n回归器，用于根据最初的动作的特征计算出回归后的动作位置，其中，动作的特征是指由特征提取器学习到的视频特征；/n池化层，用于根据整段视频特征以及回归后的动作位置为输入，输出回归后的动作特征；以及/n分类器，用于使用回归后的动作特征预测出对应于回归后位置的动作类别，/n其中，回归器位于分类器前。/n

【技术特征摘要】
1.一种用于动作的时间轴定位的回归分类模块，其特征在于，包括：
回归器，用于根据最初的动作的特征计算出回归后的动作位置，其中，动作的特征是指由特征提取器学习到的视频特征；
池化层，用于根据整段视频特征以及回归后的动作位置为输入，输出回归后的动作特征；以及
分类器，用于使用回归后的动作特征预测出对应于回归后位置的动作类别，
其中，回归器位于分类器前。

2.根据权利要求1所述的用于动作的时间轴定位的回归分类模块，其特征在于，所述回归分类模块将回归后的动作位置和其对应的回归后的动作类别作为最终输出。

3.根据权利要求1所述的用于动作的时间轴定位的回归分类模块，其特征在于，所述回归分类模块用于模型的训练的分类损失函数Lcls表示为：

其中，表示第u个实例第k个类别所对应的类别标签(比如跳远、跳高或者背景)，是使用回归后的动作的位置计算与目标动...

【专利技术属性】
技术研发人员：李革，靳策策，张涛，孔伟杰，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人