使用深度嵌入聚类的动作分类制造技术

技术编号：31734756 阅读：33 留言：0更新日期：2022-01-05 16:08

描述了一种通过应用深度嵌入聚类进行动作识别的系统。对于输入视频的各个图像帧，所述系统计算基于骨骼关节的位姿特征，所述位姿特征表示该图像帧中的人类的动作。执行所述位姿特征到嵌入动作空间中的非线性映射。执行所述动作的时间分类并获得基于分类姿势的标签的集合。基于分类姿势的标签的集合被用于控制机器的移动。机器的移动。机器的移动。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】使用深度嵌入聚类的动作分类
[0001]相关申请的交叉引用
[0002]本申请是2019年7月10日在美国提交的名称为“Action Classification Using Deep Embedded Clustering”的美国临时申请No.62/872,630的非临时申请，其全部内容通过引用并入本文。
[0003]专利技术背景
(1)

[0004]本专利技术涉及一种用于动作识别的系统，并且更具体地，涉及一种通过应用深度嵌入聚类来进行动作识别的系统。
[0005](2)相关技术描述
[0006]当前的无监督动作识别技术依赖于图像空间或位姿空间(pose space)中的聚类技术。动作识别技术可以分为两个类别：基于图像的和基于骨骼关节的。在基于图像的技术中，输入特征是根据被跟踪人员的视觉外观计算的，而在基于骨骼关节的技术中，输入特征是关节位置的关节星座(二维(2D)或三维(3D))(参见并入的参考文献列表中的参考文献No.1至No.5)。
[0007]在参考文献No.3中，Ofli等人利用一系列信息最丰富的关节来定义各个动作，所述关节捕获了不同人类动作的不变性。在各个实例中，他们基于各个动作的关节角度轨迹的均值和方差，将关节总数修减(prune down)为一个更小但信息丰富的子集。在给定关节之间的角速度的情况下，他们应用支持向量机(SVM)和K最近邻(KNN)来对动作进行分类。
[0008]Evangelidis等人定义了对相对关节位置进行编码的动作描述符(参见参考文献No....

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于动作识别的系统，所述系统包括：非暂时性计算机可读介质和一个或更多个处理器，所述非暂时性计算机可读介质上编码有可执行指令，使得当执行所述可执行指令时，所述一个或更多个处理器执行以下操作：对于输入视频的各个图像帧，计算基于骨骼关节的位姿特征，所述位姿特征表示所述图像帧中的人类的动作；执行所述位姿特征到嵌入动作空间中的非线性映射；执行所述动作的时间分类并获得基于分类姿势的标签的集合；以及基于所述基于分类姿势的标签的集合来控制机器的移动。2.根据权利要求1所述的系统，其中，所述位姿估计技术是部分亲和字段(PAF)特征生成技术。3.根据权利要求1所述的系统，其中，所述嵌入动作空间是循环神经网络(RNN)框架。4.根据权利要求3所述的系统，其中，所述RNN框架包括：第一循环层，所述第一循环层对关节位置集之间的一阶相关性进行编码，以对所述动作进行建模；以及第二循环层，所述第二循环层对所述关节位置集之间的更高阶相关性进行编码。5.根据权利要求1所述的系统，其中，时间分类是使用长短期记忆(LSTM)来执行的。6.根据权利要求3所述的系统，其中，非线性映射是使用所述RNN框架中的深度嵌入聚类来执行的。7.一种用于动作识别的计算机实现的方法，所述方法包括以下动作：使一个或更多个处理器执行在非暂时性计算机可读介质上编码的指令，使得当执行所述指令时，所述一个或更多个处理器执行以下操作：对于输入视频的各个图像帧，计算基于骨骼关节的位姿特征，所述位姿特征表示所述图像帧中的人类的动作；执行所述位姿特征到嵌入动作空间中的非线性映射；执行所述动作的时间分类并获得基于分类姿势的标签的集合；以及基于所述基于分类姿势的标签的集合来控制机器的移动。8.根据权利要求7所述的方法，其中，所述位姿估计技术是部分亲和字段(PAF)特征生成技术。9.根据权利要求7所述的方法，其中，所述嵌入动作空间是循环神经网络(RNN)框架。10.根据权利要求9所述的方法，其中，所述RNN框架包括：第一循环层，所述第一循环层对关节位置集之间的一阶相关性进行...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：赫尔实验室有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人