自动驾驶场景的深度估计网络训练方法、装置和自主车辆制造方法及图纸

技术编号：24939821 阅读：27 留言：0更新日期：2020-07-17 21:20

本申请公开了一种自动驾驶场景的深度估计网络的训练方法、装置和自主车辆。该方法包括：获取样本图像集合，样本图像的像素点标注有真实深度信息；根据样本图像集合对深度估计网络进行迭代的多轮训练，每轮训练包括：从样本图像集合中选取样本图像输入深度估计网络，得到通过深度估计网络预测的样本图像各像素点的预测深度信息；基于样本图像各像素点的真实深度信息和预测深度信息，计算第一预测误差，并基于样本图像的预定区域内的像素点的真实深度信息和预测深度信息，计算第二预测误差；基于第一预测误差和第二预测误差，调整深度估计网络的参数。本申请提供的技术方案能够解决现有的针对目标区域的深度估计精度不够准确的问题。

全部详细技术资料下载

【技术实现步骤摘要】
自动驾驶场景的深度估计网络训练方法、装置和自主车辆
本申请涉及自动驾驶
，特别是涉及一种自动驾驶场景的深度估计网络的训练方法、装置和自主车辆。
技术介绍
随着自动驾驶的发展，场景理解成为其中的重要问题，场景理解(sceneunderstanding)主要关注驾驶场景中的目标检索、检测、场景分割等，对实现自主车辆的自动驾驶具有重要作用，可以将从多个传感器的场景感知数据转化为自主运动的决策依据。而单目景深估计是其中亟待解决的关键技术。在现有的深度学习模型解决方案中，通常是通过特征提取网络，获得图像的局部特征和全局特征，由此预测图像中每个位置的深度值。然而，深度学习模型中预测得到的各个位置深度是相对独立的。在自动驾驶的许多场景下，更关心整幅图像中重点区域的深度。比如自主车辆采集的道路图像中，障碍物的深度反映出自主车辆与障碍物的距离。而现有技术中深度学习模型无法针对障碍物的实际距离进行有效估计，因而自主车辆无法完成有效的自主决策实现自动驾驶。
技术实现思路
鉴于上述问题，提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的一种自动驾驶场景的深度估计网络的训练方法、装置和自主车辆。依据本申请的一个方面，提供了一种自动驾驶场景的深度估计网络的训练方法，包括：获取样本图像集合，所述样本图像的像素点标注有真实深度信息；根据所述样本图像集合对深度估计网络进行迭代的多轮训练，每轮训练包括：从样本图像集合中选取样本图像输入深度估计网络，得到通过所述深度估计网络预测的所述...

【技术保护点】
1.一种自动驾驶场景的深度估计网络的训练方法，包括：/n获取样本图像集合，所述样本图像的像素点标注有真实深度信息；/n根据所述样本图像集合对深度估计网络进行迭代的多轮训练，每轮训练包括：从样本图像集合中选取样本图像输入深度估计网络，得到通过所述深度估计网络预测的所述样本图像各像素点的预测深度信息；基于所述样本图像各像素点的真实深度信息和预测深度信息，计算第一预测误差，并基于所述样本图像的预定区域内的像素点的真实深度信息和预测深度信息，计算第二预测误差；基于所述第一预测误差和所述第二预测误差，调整所述深度估计网络的参数。/n

【技术特征摘要】
1.一种自动驾驶场景的深度估计网络的训练方法，包括：
获取样本图像集合，所述样本图像的像素点标注有真实深度信息；
根据所述样本图像集合对深度估计网络进行迭代的多轮训练，每轮训练包括：从样本图像集合中选取样本图像输入深度估计网络，得到通过所述深度估计网络预测的所述样本图像各像素点的预测深度信息；基于所述样本图像各像素点的真实深度信息和预测深度信息，计算第一预测误差，并基于所述样本图像的预定区域内的像素点的真实深度信息和预测深度信息，计算第二预测误差；基于所述第一预测误差和所述第二预测误差，调整所述深度估计网络的参数。

2.根据权利要求1所述的方法，所述基于所述样本图像的预定区域内的像素点的真实深度信息和预测深度信息，计算第二预测误差，包括：
对于所述样本图像的预定区域内的每个像素点，基于各像素点的真实深度信息，计算第一统计分布；以及基于各像素点的预测深度信息，计算第二统计分布；
基于所述第一统计分布和所述第二统计分布之间的距离，计算第二预测误差。

3.根据权利要求2所述的方法，所述第一统计分布和所述第二统计分布之间的距离包括KL散度距离。

4.如权利要求2所述的方法，其特征在于，所述真实深度信息为真实深度图，所述计算第一统计分布包括：
计算所述真实深度图中预定区域内的第一深度均值，并计算所述真实深度图中预定区域内的深度值相对于所述第一深度均值偏差的统计分布；
所述预测深度信息为预测深度图，所述计算第二统计分布包括：
计算所述预测深度图中预定区域内的第二深度均值，并计算所述预测深度图中预定区域内的深度值相对于所述第二深度均值偏差的统计分布。

5.根据权利要求1所述的方法，所述基于所述第一预测误差和所述第二预测误差，调整所述深度估计网络的参数，包括：
若所述第一预测误差和所述第二预测误差中，至少一个预测误差不收...

【专利技术属性】
技术研发人员：周作禹，高红星，史信楚，
申请(专利权)人：北京三快在线科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人