三维关键点预测方法、训练方法及相关设备技术

技术编号：37349493 阅读：11 留言：0更新日期：2023-04-22 21:47

本申请涉及计算机视觉技术领域，公开了一种三维关键点预测方法、训练方法及相关设备，该关键点预测模型的训练方法包括：获取样本图像对，样本图像对包括第一样本图像和第二样本图像；根据第一样本图像进行三维人体构建，得到三维人体模型；在三维人体模型中进行关键点采样，得到关键点的三维坐标，关键点的三维坐标用于确定人体像素区域呈现的姿态；由关键点预测模型根据第二样本图像进行关键点预测，得到关键点的预测三维坐标；根据关键点的三维坐标和关键点的预测三维坐标，计算第一预测损失；根据第一预测损失反向训练关键点预测模型；本方案的关键点预测模型可以自动补全图像中被遮挡的关键点。中被遮挡的关键点。中被遮挡的关键点。

全部详细技术资料下载

【技术实现步骤摘要】
三维关键点预测方法、训练方法及相关设备

[0001]本申请涉及计算机视觉
，更具体地，涉及一种三维关键点预测方法、训练方法及相关设备。

技术介绍

[0002]人体姿态识别是计算机视觉
中的一个重要应用场景。人体姿态识别一般是先基于图像确定表征人体姿态的多个关键点，然后通过所确定的多个关键点进行姿态识别。
[0003]实际应用场景中，可能存在图像中关键点被遮挡的情况，在该种情况下，无法确定被遮挡的关键点，造成所确定表征姿态的关键点不全，进而可能造成姿态识别不准确。

技术实现思路

[0004]鉴于上述问题，本申请实施例提出了一种三维关键点预测方法、训练方法及相关设备，以改善上述问题。
[0005]根据本申请实施例的一个方面，提供了一种关键点预测模型的训练方法，包括：获取样本图像对，所述样本图像对包括第一样本图像和第二样本图像，所述第二样本图像是对所述第一样本图像中的人体像素区域进行部分遮挡处理或者剪裁处理后得到的；根据所述第一样本图像进行三维人体构建，得到三维人体模型；在所述三维人体模型中进行关键点采样，得到关键点的三维坐标，所述关键点的三维坐标用于确定所述人体像素区域呈现的姿态；由关键点预测模型根据所述第二样本图像进行关键点预测，得到关键点的预测三维坐标；所述关键点预测模型用于根据输入图像预测所述输入图像中具有姿态识别作用的关键点的三维坐标；根据所述关键点的三维坐标和所述关键点的预测三维坐标，计算第一预测损失；根据所述第一预测损失反向训练所述关键点预测模型。
[000...

【技术保护点】

【技术特征摘要】
1.一种关键点预测模型的训练方法，其特征在于，包括：获取样本图像对，所述样本图像对包括第一样本图像和第二样本图像，所述第二样本图像是对所述第一样本图像中的人体像素区域进行部分遮挡处理或者剪裁处理后得到的；根据所述第一样本图像进行三维人体构建，得到三维人体模型；在所述三维人体模型中进行关键点采样，得到关键点的三维坐标，所述关键点的三维坐标用于确定所述人体像素区域呈现的姿态；由关键点预测模型根据所述第二样本图像进行关键点预测，得到关键点的预测三维坐标；所述关键点预测模型用于根据输入图像预测所述输入图像中具有姿态识别作用的关键点的三维坐标；根据所述关键点的三维坐标和所述关键点的预测三维坐标，计算第一预测损失；根据所述第一预测损失反向训练所述关键点预测模型。2.根据权利要求1所述的方法，其特征在于，所述三维人体模型是通过多人线性蒙皮SMPL模型构建的；所述根据所述第一样本图像进行三维人体构建，得到三维人体模型之前，所述方法还包括：获取第三样本图像和所述第三样本图像的标注信息；由所述SMPL模型根据所述第三样本图像进行三维人体模型构建，得到预测三维人体模型；根据所述预测三维人体模型和所述第三样本图像的标注信息，计算第二预测损失；根据所述第二预测损失反向训练所述SMPL模型。3.根据权利要求2所述的方法，其特征在于，所述标注信息包括标注关键点的标注二维坐标和标注关键点的标注三维坐标；所述根据所述预测三维人体模型和所述第三样本图像的标注信息，计算第二预测损失，包括：在所述预测三维人体模型中进行标注关键点采样，得到标注关键点对应的预测三维坐标；根据目标图像采集装置的内参矩阵，将所述标注关键点对应的预测三维坐标向所述第三样本图像所在图像平面进行投影，得到所述标注关键点在所述图像平面上的预测二维坐标；所述目标图像采集装置是指采集获得所述第三样本图像的图像采集装置；根据所述标注关键点的标注三维坐标和所述标注关键点的预测三维坐标，计算三维预测损失；根据所述标注关键点的预测二维坐标和所述标注关键点的标注二维坐标，计算二维预测损失；根据所述三维预测损失和所述二维预测损失，计算所述第二预测损失。4.根据权利要求2所述的方法，其特征在于，所述标注信息包括标注关键点的标注二维坐标和标注关键点的标注三维坐标；所述获取第三样本图像和所述第三样本图像的标注信息之前，所述方法还包括：获取所述第三样本图像对应的深度图像；根据所述深度图像获取标注关键点的深度值；
根据所述标注关键点的深度值、目标图像采集装置的内参矩阵和所述标注关键点的二维坐标，确定所述标注关键点的标注三维坐标，所述目标图像采集装置是指采集获得所述第三样本图像的图像采集装置。5.根据权利要求4所述的方法，其特征在于，所述根据所述标注关键点的深度值、目标图像采集装置的内参矩阵和所述标注关键点的二维坐标，确定所述标注关键点的标注三维坐标，包括：根据所述目标图像采集装置的内参矩阵和所述标注关键点的深度值，确定所述标注关键点对应的目标变换矩阵；根据所述目标变换矩阵，将所述标注关键点的二维坐标向三维空间进行变换，得到所述标注关键点的标注三维坐标。6.根据权利要求1所述的方法，其特征在于，所述关键点预测模型包括特征提取网络和三个分支网络；其中，一个分支网络用于预测关键点在一个坐标轴上的坐标；所述预测三维坐标包括所预测到的关键点在三个坐标轴上的坐标；所述由关键点预测模型根据所述第二样本图像进行关键点预测，得到关键点的预测三维坐标，包括：通过所述特征提取网络对所述第二样本图像进行特征提取，得...

【专利技术属性】
技术研发人员：张亮，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人