System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于确定三维姿态估计模型的方法和用于确定姿态的方法技术_技高网

用于确定三维姿态估计模型的方法和用于确定姿态的方法技术

技术编号:42873362 阅读:12 留言:0更新日期:2024-09-30 15:00
本公开提供了一种用于确定三维姿态估计模型的方法和用于确定姿态的方法。具体实现方案为:通过待训练模型执行如下操作,直至待训练模型训练结束,得到三维姿态估计模型:对于任一个批次中的任一包含样本对象的样本图像,利用待训练模型确定该样本图像的预测结果;基于每个可见关键点的深度真值和预测结果中的相对深度预测值,确定每个可见关键点相对于参考关键点的相对深度真值和相对深度预测值;基于预测结果中参考关键点的相对深度预测值和目标关键点的绝对深度预测值,确定参考关键点的绝对深度预测值;基于确定的各预测值和各真值,确定该样本图像的模型损失;基于该批次中各样本图像分别对应的模型损失,对待训练模型的模型参数进行更新。

【技术实现步骤摘要】

本公开涉及人工智能,尤其是一种用于确定三维姿态估计模型的方法和用于确定姿态的方法


技术介绍

1、在运动识别、虚拟现实(virtual reality,简称:vr)、人机交互、危险场所作业人员姿态识别等场景,人体三维(3d)姿态估计被广泛应用。人体三维姿态估计通常需要基于三维姿态估计模型实现。


技术实现思路

1、第一方面,本公开实施例提供了一种用于确定三维姿态估计模型的方法,包括:获取包含样本对象的多个样本图像;其中,每个样本图像带有样本对象的预设关键点集合中每个预设关键点的图像坐标真值和至少一个可见关键点分别对应的深度真值;可见关键点为预设关键点集合中在该样本图像中可见的预设关键点;多个样本图像划分为多个批次,每个批次包括至少一个样本图像;通过待训练模型执行如下操作,直至待训练模型训练结束,得到三维姿态估计模型:对于任一个批次中的任一样本图像,利用待训练模型确定该样本图像的预测结果;其中,预测结果包括:每个预设关键点的图像坐标预测值、每个预设关键点相对于预设关键点集合中的目标关键点的相对深度预测值、目标关键点的绝对深度预测值;基于该样本图像中的每个可见关键点的深度真值和每个可见关键点相对于目标关键点的相对深度预测值,确定该样本图像中的每个可见关键点相对于该样本图像中参考关键点的相对深度真值和相对深度预测值;其中,参考关键点为该样本图像中至少一个可见关键点中的其中一个;基于参考关键点相对于目标关键点的相对深度预测值和目标关键点的绝对深度预测值,确定参考关键点的绝对深度预测值;基于每个可见关键点相对于参考关键点的相对深度真值和相对深度预测值、参考关键点的绝对深度预测值和深度真值、每个预设关键点的图像坐标真值和图像坐标预测值,确定该样本图像的模型损失;基于该批次中各样本图像分别对应的模型损失,对待训练模型的模型参数进行更新。

2、第二方面,本公开实施例提供了一种用于确定三维姿态的方法,包括:获取包含目标对象的目标图像;利用预先获得的目标三维姿态估计模型确定目标图像对应的预测结果;其中,目标三维姿态估计模型基于上述任一实施例提供的用于确定三维姿态估计模型的方法获得;预测结果包括:目标图像中每个预设关键点的图像坐标预测值、每个预设关键点相对于预设关键点集合中的目标关键点的相对深度预测值、目标关键点的绝对深度预测值;基于预测结果,确定目标对象的三维姿态。

3、第三方面,本公开实施例提供了一种用于确定三维姿态估计模型的装置,包括:样本获取模块,用于获取包含样本对象的多个样本图像;其中,每个样本图像带有样本对象的预设关键点集合中每个预设关键点的图像坐标真值和至少一个可见关键点分别对应的深度真值;可见关键点为预设关键点集合中在该样本图像中可见的预设关键点;多个样本图像划分为多个批次,每个批次包括至少一个样本图像;模型训练模块,用于通过待训练模型执行如下操作,直至待训练模型训练结束,得到三维姿态估计模型:对于任一个批次中的任一样本图像,利用待训练模型确定该样本图像的预测结果;其中,预测结果包括:每个预设关键点的图像坐标预测值、每个预设关键点相对于预设关键点集合中的目标关键点的相对深度预测值、目标关键点的绝对深度预测值;基于该样本图像中的每个可见关键点的深度真值和每个可见关键点相对于目标关键点的相对深度预测值,确定该样本图像中的每个可见关键点相对于该样本图像中参考关键点的相对深度真值和相对深度预测值;其中,参考关键点为该样本图像中至少一个可见关键点中的其中一个;基于参考关键点相对于目标关键点的相对深度预测值和目标关键点的绝对深度预测值,确定参考关键点的绝对深度预测值;基于每个可见关键点相对于参考关键点的相对深度真值和相对深度预测值、参考关键点的绝对深度预测值和深度真值、每个预设关键点的图像坐标真值和图像坐标预测值,确定该样本图像的模型损失;基于该批次中各样本图像分别对应的模型损失,对待训练模型的模型参数进行更新。

4、第四方面,本公开实施例提供了一种用于确定三维姿态的装置,包括:图像获取模块,用于获取包含目标对象的目标图像;预测模块,用于利用预先获得的目标三维姿态估计模型确定目标图像对应的预测结果;其中,目标三维姿态估计模型基于上述任一实施例提供的用于确定三维姿态估计模型的方法获得;预测结果包括:目标图像中每个预设关键点的图像坐标预测值、每个预设关键点相对于预设关键点集合中的目标关键点的相对深度预测值、目标关键点的绝对深度预测值;基于预测结果,确定目标对象的三维姿态;三维姿态确定模块,用于基于预测结果,确定目标对象的三维姿态。

5、第五方面,本公开实施例提供了一种计算机可读存储介质,该存储介质存储有计算机程序,该计算机程序用于执行本公开上述任一实施例提供的用于确定三维姿态估计模型的方法和上述任一实施例提供的用于确定三维姿态的方法中的至少一者。

6、第六方面,本公开实施例提供了一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器;处理器,用于从存储器中读取可执行指令并执行该指令,以实现本公开上述任一实施例提供的用于确定三维姿态估计模型的方法和上述任一实施例提供的用于确定三维姿态的方法中的至少一者。

7、下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

本文档来自技高网...

【技术保护点】

1.一种用于确定三维姿态估计模型的方法,包括:

2.根据权利要求1所述的方法,其中,还包括:基于该样本图像中所述样本对象的所述至少一个可见关键点,确定所述参考关键点;

3.根据权利要求2所述的方法,其中,所述响应于所述至少一个可见关键点中不包括所述目标关键点,从所述至少一个可见关键点中确定一个可见关键点作为所述参考关键点,包括:

4.根据权利要求1所述的方法,其中,所述模型损失包括:深度损失、目标关键点损失、图像坐标损失,所述基于每个所述可见关键点相对于所述参考关键点的相对深度真值和相对深度预测值、所述参考关键点的绝对深度预测值和深度真值、每个所述预设关键点的图像坐标真值和图像坐标预测值,确定该样本图像的模型损失,包括:

5.根据权利要求4所述的方法,其中,响应于所述至少一个可见关键点不包括所述目标关键点,所述基于该样本图像中的每个所述可见关键点的深度真值和每个所述可见关键点相对于所述目标关键点的相对深度预测值,确定该样本图像中的每个所述可见关键点相对于该样本图像中参考关键点的相对深度真值和相对深度预测值,包括:

6.根据权利要求5所述的方法,其中,所述基于每个所述可见关键点相对于所述参考关键点的相对深度真值和相对深度预测值,确定该样本图像的深度损失,包括:

7.根据权利要求1所述的方法,其中,在得到所述三维姿态估计模型之后,还包括:

8.根据权利要求1所述的方法,其中,在得到所述三维姿态估计模型之后,还包括:

9.根据权利要求8所述的方法,其中,所述基于该测试图像中的每个所述可见测试关键点相对于所述目标测试关键点的相对深度预测值、所述目标测试关键点的绝对深度预测值、每个所述可见测试关键点的图像坐标预测值、拍摄所述测试图像的相机的相机内参,得到每个所述可见测试关键点在所述相机坐标系下相对于参考点的三维相对坐标预测值,包括:

10.根据权利要求1-9任一所述的方法,其中,所述多个样本图像中包括至少一个目标样本图像,所述目标样本图像中样本对象的至少一个可见关键点包括所述目标关键点。

11.一种用于确定三维姿态的方法,包括:

12.根据权利要求11所述的方法,其中,所述基于所述预测结果,确定所述目标对象的三维姿态,包括:

13.一种用于确定三维姿态估计模型的装置,包括:

14.一种用于确定三维姿态的装置,包括:

15.一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述权利要求1-10任一所述的用于确定三维姿态估计模型的方法和上述权利要求11-12任一所述的用于确定三维姿态的方法中的至少一者。

16.一种电子设备,所述电子设备包括:

...

【技术特征摘要】

1.一种用于确定三维姿态估计模型的方法,包括:

2.根据权利要求1所述的方法,其中,还包括:基于该样本图像中所述样本对象的所述至少一个可见关键点,确定所述参考关键点;

3.根据权利要求2所述的方法,其中,所述响应于所述至少一个可见关键点中不包括所述目标关键点,从所述至少一个可见关键点中确定一个可见关键点作为所述参考关键点,包括:

4.根据权利要求1所述的方法,其中,所述模型损失包括:深度损失、目标关键点损失、图像坐标损失,所述基于每个所述可见关键点相对于所述参考关键点的相对深度真值和相对深度预测值、所述参考关键点的绝对深度预测值和深度真值、每个所述预设关键点的图像坐标真值和图像坐标预测值,确定该样本图像的模型损失,包括:

5.根据权利要求4所述的方法,其中,响应于所述至少一个可见关键点不包括所述目标关键点,所述基于该样本图像中的每个所述可见关键点的深度真值和每个所述可见关键点相对于所述目标关键点的相对深度预测值,确定该样本图像中的每个所述可见关键点相对于该样本图像中参考关键点的相对深度真值和相对深度预测值,包括:

6.根据权利要求5所述的方法,其中,所述基于每个所述可见关键点相对于所述参考关键点的相对深度真值和相对深度预测值,确定该样本图像的深度损失,包括:

7.根据权利要求1所述的方法,其中,在...

【专利技术属性】
技术研发人员:程征
申请(专利权)人:优奈柯恩北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1