动作识别模型的训练方法、装置、设备、存储介质和产品制造方法及图纸

技术编号：34385061 阅读：32 留言：0更新日期：2022-08-03 21:06

本申请提供了一种动作识别模型的训练方法、装置、设备、存储介质和产品，属于人工智能技术领域，能够应用于对多媒体资源的处理场景中。方法包括：获取多个样本视频；对样本视频中的目标对象进行分割，得到样本视频对应的多个动作部位，多个动作部位为目标对象的动作部位；确定多个动作部位之间的相对位置向量，得到样本视频对应的相对位置向量，相对位置向量用于表示多个动作部位之间的位置关系；基于多个样本视频分别对应的相对位置向量，对多个样本视频进行聚类，得到多个视频簇，视频簇包括至少一个样本视频，且同一视频簇中的样本视频的动作相同；基于多个视频簇，训练动作识别模型。该方法提高了动作识别模型的训练效率。该方法提高了动作识别模型的训练效率。该方法提高了动作识别模型的训练效率。

全部详细技术资料下载

【技术实现步骤摘要】
动作识别模型的训练方法、装置、设备、存储介质和产品

[0001]本申请涉及人工智能
，特别涉及一种动作识别模型的训练方法、装置、设备、存储介质和产品。

技术介绍

[0002]随着人工智能技术的发展，动作识别模型的应用越来越广泛；例如，动作识别模型可以应用在智能教育场景；通过动作识别模型，对教师授课视频中的动作进行识别，从而基于识别得到的动作类别，对该教师进行人工智能(Artificial Intelligence，AI)评教。
[0003]相关技术中是采用有监督的深度学习算法来训练动作识别模型的，也即通过有标签的样本视频来训练动作识别模型。而样本视频中的动作标签是人标注的，由于样本视频的数据量很大，因此，人工标注样本视频的动作标签会花费较多时间，从而降低了动作识别模型的训练效率。

技术实现思路

[0004]本申请实施例提供了一种动作识别模型的训练方法、装置、设备、存储介质和产品，能够提高动作识别模型的训练效率。所述技术方案如下：
[0005]一方面，提供了一种动作识别模型的训练方法，所述方法包括：
[0006]获取多个样本视频；
[0007]对所述样本视频中的目标对象进行分割，得到所述样本视频对应的多个动作部位，所述多个动作部位为所述目标对象的动作部位，所述目标对象为做出动作的对象；
[0008]确定所述多个动作部位之间的相对位置向量，得到所述样本视频对应的相对位置向量，所述相对位置向量用于表示所述多个动作部位之间的位置关系；
[0009]基于所述...

【技术保护点】

【技术特征摘要】
1.一种动作识别模型的训练方法，其特征在于，所述方法包括：获取多个样本视频；对所述样本视频中的目标对象进行分割，得到所述样本视频对应的多个动作部位，所述多个动作部位为所述目标对象的动作部位，所述目标对象为做出动作的对象；确定所述多个动作部位之间的相对位置向量，得到所述样本视频对应的相对位置向量，所述相对位置向量用于表示所述多个动作部位之间的位置关系；基于所述多个样本视频分别对应的相对位置向量，对所述多个样本视频进行聚类，得到多个第一视频簇，所述第一视频簇包括至少一个样本视频，且同一第一视频簇中的样本视频的动作相同；基于所述多个第一视频簇，训练动作识别模型。2.根据权利要求1所述的方法，其特征在于，所述确定所述多个动作部位之间的相对位置向量，得到所述样本视频对应的相对位置向量，包括：基于所述样本视频对应的多个动作部位的部位信息，确定所述多个动作部位中的第一动作部位和多个第二动作部位，所述第一动作部位为所述目标对象的基准动作部位；确定所述多个第二动作部位相对于所述第一动作部位的相对位置向量，得到所述样本视频对应的相对位置向量。3.根据权利要求2所述的方法，其特征在于，所述确定所述多个第二动作部位相对于所述第一动作部位的相对位置向量，得到所述样本视频对应的相对位置向量，包括：分别确定第一中心位置和第二中心位置，所述第一中心位置为所述第一动作部位的中心位置，所述第二中心位置为所述第二动作部位的中心位置；将所述第一中心位置与所述第二中心位置之间的向量确定为所述第二动作部位相对于所述第一动作部位的相对位置向量；将所述多个第二动作部位相对于所述第一动作部位的相对位置向量，组成所述样本视频对应的相对位置向量。4.根据权利要求2所述的方法，其特征在于，所述确定所述多个第二动作部位相对于所述第一动作部位的相对位置向量，得到所述样本视频对应的相对位置向量，包括：分别确定第一中心位置和多个边界位置，所述第一中心位置为所述第一动作部位的中心位置，所述多个边界位置分别为所述第二动作部位的边界位置；确定所述第一中心位置分别与所述多个边界位置之间的向量；将所述第一中心位置分别与所述多个边界位置之间的向量进行拼接，得到所述第二动作部位相对于所述第一动作部位的相对位置向量；将所述多个第二动作部位相对于所述第一动作部位的相对位置向量，组成所述样本视频对应的相对位置向量。5.根据权利要求1所述的方法，其特征在于，所述样本视频包括多个视频帧，所述样本视频对应的相对位置向量包括所述多个视频帧分别对应的相对位置向量；所述基于所述多个样本视频分别对应的相对位置向量，对所述多个样本视频进行聚类，得到多个第一视频簇，包括：将同一视频帧对应的多个相对位置向量进行拼接，得到所述同一视频帧对应的第一相对位置向量；
将同一样本视频的多个同一视频帧对应的第一相对位置向量进行拼接，得到所述样本视频对应的第二相对位置向量；基于所述多个样本视频分别对应的第二相对位置向量，对所述多个样本视频进行聚类，得到所述多个第一视频簇。6.根据权利要求5所述的方法，其特征在于，所述基于所述多个样本视频分别对应的第二相对位置向量，对所述多个样本视频进行聚类，得到所述多个第一视频簇，包括：基于所述多个样本视频分别对应的第二相对位置向量，确定任意两个第二相对位置向量之间的距离；在所述距离不大于预设距离的情况下，将所述两个第二相对位置向量对应的两个样本视频聚合到同一第一视频簇中...

【专利技术属性】
技术研发人员：陈柯辛，武子熙，蒋昊青，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人