一种自动驾驶BEV任务学习方法及相关装置制造方法及图纸

技术编号：38276418 阅读：30 留言：0更新日期：2023-07-27 10:27

本申请提供一种自动驾驶BEV任务学习方法及相关装置，该方法主要通过获得的鸟瞰图BEV特征来表征几何深度信息特征，由于该BEV特征是对时序立体匹配的点云数据和深度估计出的点云数据进行融合、归一化处理和对齐，获得对齐后的点云数据，并对多视角图像的图像特征中提取的上下文特征与对齐后的点云数据进行外积操作和体素池化操作获得的，因此，该BEV特征是能够表征感知世界的视角或坐标系的特征，所以该BEV特征也能够表征几何深度信息特征，从而通过使用BEV特征对机器视觉任务进行学习，能够有效地避免自动驾驶汽车在行驶时的安全隐患。隐患。隐患。

全部详细技术资料下载

【技术实现步骤摘要】
一种自动驾驶BEV任务学习方法及相关装置

[0001]本申请涉及自动驾驶、仿真测试、任务学习和模型训练的
，具体而言，涉及一种自动驾驶BEV任务学习方法及相关装置。

技术介绍

[0002]目前，在自动驾驶的应用场景中，通常是使用单相机或者多相机采集图像中提取的特征来进行机器视觉任务学习和推理，具体例如：获取多相机采集的环境图像，并提取出环境图像中的图像特征，然后，使用机器视觉任务学习后的模型对该图像特征进行目标对象(例如障碍物或行人等等)检测等等。在具体的实践过程中发现，虽然能够利用这种图像特征预测出目标对象在相机视野内的相对位置，但是很难精确地预测出目标对象与该相机之间的距离(即几何深度信息)，可能导致自动驾驶汽车在行驶时存在安全隐患。

技术实现思路

[0003]本申请实施例的目的在于提供一种自动驾驶BEV任务学习方法及相关装置，用于改善自动驾驶汽车在行驶时存在安全隐患的问题。
[0004]本申请实施例提供了一种自动驾驶BEV任务学习方法，包括：获取自动驾驶场景中的当前时刻的第一多视角图像，并提取出第一多视角图像的图像特征，多视角图像是同一时刻从自动驾驶场景中的自动驾驶车辆的多个视角拍摄的图像；获取上一时刻的第二多视角图像的图像特征，并对第一多视角图像的图像特征与第二多视角图像的图像特征进行时序立体匹配，获得匹配的点云数据，第一多视角图像的拍摄视角与第二多视角图像的拍摄视角是相同的；对第一多视角图像的图像特征进行深度估计，获得估计出的点云数据，并对估计出的点云数据和匹配的点云数据进行融...

【技术保护点】

【技术特征摘要】
1.一种自动驾驶BEV任务学习方法，其特征在于，包括：获取自动驾驶场景中的当前时刻的第一多视角图像，并提取出所述第一多视角图像的图像特征，所述多视角图像是同一时刻从所述自动驾驶场景中的自动驾驶车辆的多个视角拍摄的图像；获取上一时刻的第二多视角图像的图像特征，并对所述第一多视角图像的图像特征与所述第二多视角图像的图像特征进行时序立体匹配，获得匹配的点云数据，所述第一多视角图像的拍摄视角与所述第二多视角图像的拍摄视角是相同的；对所述第一多视角图像的图像特征进行深度估计，获得估计出的点云数据，并对所述估计出的点云数据和所述匹配的点云数据进行融合、归一化处理和对齐，获得对齐后的点云数据；根据所述第一多视角图像的相机参数从所述第一多视角图像的图像特征中提取出上下文特征，并对所述上下文特征和所述对齐后的点云数据进行外积操作和体素池化操作，获得鸟瞰图BEV特征，所述BEV特征用于对至少一个机器视觉任务进行学习。2.根据权利要求1所述的方法，其特征在于，所述对所述第一多视角图像的图像特征与所述第二多视角图像的图像特征进行时序立体匹配，包括：计算所述第一多视角图像的图像特征与所述第二多视角图像的图像特征之间的单应性矩阵；获取所述上一时刻的深度信息，使用所述单应性矩阵对所述上一时刻的深度信息进行深度估计，获得当前时刻的深度信息；对所述当前时刻的深度信息和所述第一多视角图像的图像特征进行网格采样，获得特征体；对所述特征体和所述第一多视角图像的图像特征进行组相关相似度计算，获得代价体；对所述代价体进行正则化，获得所述匹配的点云数据。3.根据权利要求1所述的方法，其特征在于，所述对所述第一多视角图像的图像特征进行深度估计，包括：使用单目深度估计网络对所述第一多视角图像的图像特征进行点云预测估计，获得估计出的点云数据，所述单目深度估计网络是使用激光雷达获取的点云数据训练获得的。4.根据权利要求1所述的方法，其特征在于，所述对所述估计出的点云数据和所述匹配的点云数据进行融合、归一化处理和对齐，包括：对所述估计出的点云数据和所述匹配的点云数据进行融合，获得融合的点云数据；对所述融合的点云数据进行归一化，获得归一化后的点云数据；对所述归一化的点云数据进行对齐，获得所述对齐后的点云数据。5.根据权利要求1所述的方法，其特征在于，所述相机参数包括：内部参数和外部参数；所述根据所述第一多视角图像的相机参数从所述第一多视角图像的图像特征中提取出上下文特征，包括：将所述内部参数和...

【专利技术属性】
技术研发人员：郝坤坤，黄浴，潘余曦，杨子江，
申请(专利权)人：西安深信科创信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人