一种预测模型的训练方法以及信息预测方法技术

技术编号：42741217 阅读：21 留言：0更新日期：2024-09-18 13:35

本申请提供了一种预测模型的训练方法以及信息预测方法。其中，预测模型的训练方法包括：获取利用单目相机采集到的样本图像以及对应的预测标注结果；利用所述待训练的预测模型中的第一骨干网络以及第二骨干网络分别对所述样本图像进行特征提取，以获得所述样本图像对应的第一特征图以及第二特征图；利用所述三维信息预测头部基于所述融合特征图得到所述指定关键点的三维信息预测结果；至少利用所述第一三维信息损失调整所述待训练的预测模型的模型参数，直至第一三维信息损失满足设定要求，以得到训练后的预测模型。本申请的技术方案能够降低三维信息的预测成本，提高三维信息的预测效率，以及三维信息的预测精准度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及计算机视觉领域，尤其涉及一种预测模型的训练方法以及信息预测方法。

技术介绍

1、作为一种能够用于预测物体在空间内的三维信息的技术，3d(dimensions，三维)目标检测技术已在自动驾驶等领域被广泛应用。但现有的3d目标检测技术在应用过程中往往存在三维信息的预测成本较高的问题。以将3d目标检测技术应用于自动驾驶领域为例，在自动驾驶领域，现有的3d目标检测技术往往需要依靠车载激光雷达采集到的点云数据来预测物体在空间中的三维信息。依靠车载激光雷达采集到的点云数据虽然能够预测出物体在空间中的三维信息，但是三维信息的预测成本往往较高。

2、因此，如何降低三维信息的预测成本，成为了3d目标检测技术发展过程中亟待解决的技术问题。

技术实现思路

1、本申请实施例提供一种预测模型的训练方法以及信息预测方法，以在降低三维信息的预测成本。

2、第一方面，本申请实施例提供了一种预测模型的训练方法，包括：

3、获取利用单目相机采集到的样本图像以及对应的预测标注结果；预测标注结果至少包括指定关键点在预设相机坐标系中对应的三维信息标注结果；指定关键点为针对样本图像中的目标对象指定的关键点；

4、将样本图像输入至待训练的预测模型，并利用待训练的预测模型中的第一骨干网络以及第二骨干网络分别对样本图像进行特征提取，以获得样本图像对应的第一特征图以及第二特征图；第一特征图用于预测指定关键点在预设像素坐标系中对应的二维信息；第二特征图用于预测目标对象在预设相机坐标系中对应的深度信息；

5、利用待训练的预测模型中的三维信息预测头部对第一特征图以及第二特征图进行特征融合，得到融合特征图，并利用三维信息预测头部基于融合特征图得到指定关键点的三维信息预测结果；

6、至少利用三维信息标注结果以及三维信息预测结果，计算样本图像对应的第一三维信息损失，并至少利用第一三维信息损失调整待训练的预测模型的模型参数，直至第一三维信息损失满足设定要求，以得到训练后的预测模型。

7、第二方面，本申请实施例提供了一种信息预测方法，包括：

8、获取单目相机采集到的图像；

9、将图像输入至利用本申请实施例提供的预测模型的训练方法训练得到的训练后的预测模型，获得训练后的预测模型针对图像输出的三维信息预测结果。

10、本申请实施例的技术方案，在获取利用单目相机采集到的样本图像以及对应的预测标注结果后，会先将样本图像输入至待训练的预测模型，并利用待训练的预测模型中的第一骨干网络以及第二骨干网络分别对样本图像进行特征提取，以获得样本图像对应的第一特征图以及第二特征图，然后，再利用待训练的预测模型中的三维信息预测头部对第一特征图以及第二特征图进行特征融合，得到融合特征图，并利用三维信息预测头部基于融合特征图得到指定关键点的三维信息预测结果，之后，会至少利用三维信息标注结果以及三维信息预测结果，计算样本图像对应的第一三维信息损失，并至少利用第一三维信息损失调整待训练的预测模型的模型参数，直至第一三维信息损失满足设定要求，以得到训练后的预测模型。

11、由于训练后的预测模型是利用单目相机采集到的样本图像以及对应的预测标注结果训练得到的模型，并且预测标注结果至少包括指定关键点在预设相机坐标系中对应的三维信息标注结果，因此，将利用单目相机采集到的图像输入至训练后的预测模型，即可获得该训练后的预测模型针对图像输出的三维信息预测结果。由于相对于利用激光雷达采集点云数据来获取三维信息预测结果而言，利用单目相机采集图像来获取三维信息预测结果，在获取三维信息预测结果过程中所需的硬件成本更低，也即是说，利用单目相机采集图像来获取三维信息预测结果能够降低三维信息的预测成本。

12、另外，由于待训练的预测模型在获得样本图像对应的第一特征图以及第二特征图后，通过对第一特征图以及第二特征图进行特征融合，得到融合特征图，并利用融合特征图即可得到三维信息预测结果，因此，将单目相机采集到的图像输入至训练后的预测模型中，即可获得该训练后的预测模型针对单目相机采集到的图像获得三维信息预测结果，无需人为的执行一些复杂的计算、公式转换等操作。这样，不仅大大提高了三维信息的预测效率，而且还能够提高三维信息的预测精准度。

13、上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本申请进一步的方面、实施方式和特征将会是容易明白的。

本文档来自技高网...

【技术保护点】

1.一种预测模型的训练方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述预测标注结果还包括所述指定关键点在所述预设像素坐标系中对应的二维信息标注结果，以及所述目标对象在所述预设相机坐标系中对应的深度信息标注结果；所述方法还包括：

3.根据权利要求2所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述利用所述二维信息损失、所述深度信息损失、所述第一三维信息损失以及所述第二三维信息损失，调整所述待训练的预测模型的模型参数，包括：

5.一种信息预测方法，其特征在于，包括：

6.根据权利要求5所述的方法，其特征在于，所述方法还包括：

【技术特征摘要】

1.一种预测模型的训练方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述方...

【专利技术属性】
技术研发人员：李谦，
申请(专利权)人：华人运通上海自动驾驶科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人