深度预测模型训练方法、深度预测方法及相关装置制造方法及图纸

技术编号:34410380 阅读:18 留言:0更新日期:2022-08-03 22:01
本发明专利技术实施例公开了一种深度预测模型训练方法、深度预测方法及相关装置,包括:获取训练图像集,将深度预测范围划分为多个连续的深度类别;针对每张训练图像,根据深度值计算像素点属于各个深度类别的概率,并将概率作为像素点属于各个深度类别的标签值;采用训练图像和标签值训练深度预测模型,深度预测模型输出像素点属于各个深度类别的概率,并将该概率作为像素点属于深度类别的置信度,通过深度值计算概率作为标签,实现了对标签进行平滑,更准确地标注了处于深度类别边界的像素点,采用该标签训练的深度预测模型对深度类别边界的像素点的分类结果准确度高,分类结果以概率作为置信度,置信度平滑,并且能够反映分类结果的可信度。可信度。可信度。

【技术实现步骤摘要】
深度预测模型训练方法、深度预测方法及相关装置


[0001]本专利技术实施例涉及人工智能
,尤其涉及一种深度预测模型训练方法、深度预测方法、装置、电子设备和存储介质。

技术介绍

[0002]在自动驾驶车辆中通过摄像头、雷达等多种传感器来感知环境,以便基于所感知到的环境进行驾驶决策,而对摄像头采集到的图像进行深度预测来获得障碍物到自动驾驶车辆的距离至关重要。
[0003]目前,在训练深度预测模型时,通常设置多个深度类别,图像中像素点的深度值属于某一个深度类别时标注标签为1,反之标注标签为0,这就导致处于深度类别边界附近的像素点标注的标签出现突变,采用该图像训练深度预测模型后,该深度预测模型的预测结果同样采用0或1表示某一像素点是否属于各个深度类别,这就造成深度类别边界附近的像素点的深度分类结果存在预测不准确,以及用0或1作为分类结果的置信度出现置信度突变,无法反映分类结果可信度的问题。

技术实现思路

[0004]本专利技术实施例提供一种深度预测模型训练方法、深度预测方法、装置、电子设备和存储介质,以解决现有深度预测模块的分类结果存在预测不准确、置信度突变以及无法反映分类结果可信度的问题。
[0005]第一方面,本专利技术实施例提供了一种深度预测模型训练方法,包括:
[0006]获取训练图像集,所述训练图像集中每张训练图像的像素点关联有深度值;
[0007]将预设深度预测范围划分为多个连续的深度类别;
[0008]针对每张训练图像,根据所述深度值计算所述像素点属于各个所述深度类别的概率,并将所述概率作为所述像素点属于各个所述深度类别的标签值;
[0009]采用所述训练图像和所述标签值训练深度预测模型,所述深度预测模型用于输出所述像素点属于各个所述深度类别的概率,其中,所述深度类别对应的概率为所述像素点属于所述深度类别的置信度。
[0010]第二方面,本专利技术实施例提供了一种深度预测方法,包括:
[0011]获取待预测图像;
[0012]将所述待预测图像输入预先训练好的深度预测模型中,得到所述待预测图像中每个像素点属于各个深度类别的置信度;
[0013]从各个置信度中确定出最大置信度;
[0014]将所述最大置信度和所述最大置信度对应的深度类别作为最终预测结果;
[0015]其中,所述深度预测模型通过第一方面所述的深度预测模型训练方法所训练。
[0016]第三方面,本专利技术实施例提供了一种深度预测模型训练装置,包括:
[0017]训练图像集获取模块,用于获取训练图像集,所述训练图像集中每张训练图像的
像素点关联有深度值;
[0018]深度类别划分模块,用于将预设深度预测范围划分为多个连续的深度类别;
[0019]标注模块,用于针对每张训练图像,根据所述深度值计算所述像素点属于各个所述深度类别的概率,并将所述概率作为所述像素点属于各个所述深度类别的标签值;
[0020]训练模块,用于采用所述训练图像和所述标签值训练深度预测模型,所述深度预测模型用于输出所述像素点属于各个所述深度类别的概率,其中,所述深度类别对应的概率为所述像素点属于所述深度类别的置信度。
[0021]第四方面,本专利技术实施例提供了一种深度预测装置,包括:
[0022]待预测图像获取模块,用于获取待预测图像;
[0023]预测模块,用于将所述待预测图像输入预先训练好的深度预测模型中,得到所述待预测图像中每个像素点属于各个深度类别的置信度;
[0024]最大置信度确定模块,用于从各个置信度中确定出最大置信度;
[0025]预测结果确定模块,用于将所述最大置信度和所述最大置信度对应的深度类别作为最终预测结果;
[0026]其中,所述深度预测模型通过第一方面所述的深度预测模型训练方法所训练。
[0027]第五方面,本专利技术实施例还提供了一种电子设备,所述电子设备包括:
[0028]一个或多个处理器;
[0029]存储器,用于存储一个或多个计算机程序;
[0030]当所述一个或多个计算机程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的深度预测模型训练方法,和/或,第二方面所述的深度预测方法。
[0031]第六方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面所述的深度预测模型训练方法,和/或,第二方面所述的深度预测方法。
[0032]本专利技术实施例在训练深度预测模型时,将预设深度预测范围划分为多个连续的深度类别之后,对于每张训练图像,采用深度值计算训练图像中每个像素点属于各个深度类别的概率,并将概率作为像素点属于各个深度类别的标签值,采用训练图像和标签值训练深度预测模型,该深度预测模型输出像素点属于各个深度类别的概率,并将该概率作为像素点属于深度类别的置信度,一方面,相比于采用像素点的深度值属于某个深度类别来用0或1作为标签值,采用概率作为标签值使得标签值更为平滑,更准确地标注了处于深度类别边界的像素点,采用该标签训练的深度预测模型对深度类别边界的像素点的分类结果准确度高,以该概率作为深度预测模型输出的深度分类结果的置信度也更为平滑,避免了置信度突变的问题,另一方面,以概率作为分类结果的置信度,相比于以0或1作为置信度,可以选择置信度高的分类结果作为最终分类结果,置信度也更能准确反映最终分类结果的可信度。
附图说明
[0033]图1为本专利技术实施例一提供的一种深度预测模型训练方法的步骤流程图;
[0034]图2是本专利技术实施例二提供的一种深度预测模型训练方法的步骤流程图;
[0035]图3是本专利技术实施例三提供的一种深度预测方法的步骤流程图;
[0036]图4为本专利技术实施例四提供的一种深度预测模型训练装置的结构示意图;
[0037]图5是本专利技术实施例五提供的一种深度预测装置的流程图;
[0038]图6为本专利技术实施例六提供的一种电子设备结构示意图。
具体实施方式
[0039]下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。
[0040]本专利技术实施例的深度预测是通过自动驾驶车辆上的摄像头采集图像后,将所采集到的图像输入深度预测模型中来预测深度图中各个像素点的深度值属于各个深度类别的预测值,在现有技术中,在训练深度预测模型时,先将所预测的深度范围划分为多个在深度上连续的深度类别,例如,深度类别1为0

3米,深度类别2为3

6米,深度类别3为6

9米,深度类别4为9

12米,如果训练图像中像素点A的深度值为3.01米,则像素点A的标签为(0,1,0,0),该标签表示像素点A属于深度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度预测模型训练方法,其特征在于,包括:获取训练图像集,所述训练图像集中每张训练图像的像素点关联有深度值;将预设深度预测范围划分为多个连续的深度类别;针对每张训练图像,根据所述深度值计算所述像素点属于各个所述深度类别的概率,并将所述概率作为所述像素点属于各个所述深度类别的标签值;采用所述训练图像和所述标签值训练深度预测模型,所述深度预测模型用于输出所述像素点属于各个所述深度类别的概率,其中,所述深度类别对应的概率为所述像素点属于所述深度类别的置信度。2.如权利要求1所述的深度预测模型训练方法,其特征在于,所述将预设的深度预测范围划分为多个连续的深度类别,包括:按照预设距离将所述深度预测范围划分为多个连续的、等距的深度类别。3.如权利要求2所述的深度预测模型训练方法,其特征在于,所述针对每张训练图像,根据所述深度值计算所述像素点属于各个所述深度类别的概率,并将所述概率作为所述像素点属于各个所述深度类别的标签值,包括:计算每个所述深度类别的中心点深度值;针对每张训练图像中的像素点,采用所述像素点的深度值、所述中心点深度值以及预设的超参数计算每个所述像素点属于所述深度类别的概率作为所述像素点的标签值。4.如权利要求3所述的深度预测模型训练方法,其特征在于,所述计算每个所述深度类别的中心点深度值,包括:获取所述深度类别的起始深度值和终点深度值;计算所述终点深度值与起始深度值的差值;计算所述差值与0.5的乘积;计算所述起始深度值与所述乘积的和值得到所述深度类别的中心点深度值。5.如权利要求3所述的深度预测模型训练方法,其特征在于,所述针对每张训练图像中的像素点,采用所述像素点的深度值、所述中心点深度值以及预设的超参数计算每个所述像素点属于所述深度类别的概率作为所述像素点的标签值,包括:通过以下公式计算所述像素点属于所述深度类别的概率:其中,P
ij
为像素点j的深度值d
j
属于深度类别i的概率,M
i
为深度类别i的中心点深度值,σ为预先设置的超参数。6.如权利要求1

5任一项所述的深度预测模型训练方法,其特征在于,所述采用所述训练图像和所述标签值训练深度预测模型,包括:随机提取所述训练图像输入深度预测模型中得到每个像素点属于各个深度类别的预测概率;采用所述预测概率和所述像素点的标签值计算损失率;判断所述损失率是否小于预设阈值;若是,停止对所述深度预测模型进行训练,得到训练好的深度预测模型;
若否,采用所述损失率调整所述深度预测模型的模型参数,返回随机提取所述训练图像输入深度预测模型中得...

【专利技术属性】
技术研发人员:鲁赵晗韩旭
申请(专利权)人:广州文远知行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1