一种面向灯塔认知多场景鲁棒的视觉3D目标检测方法技术

技术编号：40346945 阅读：8 留言：0更新日期：2024-02-09 14:32

本申请提供一种面向灯塔认知多场景鲁棒的视觉3D目标检测方法，涉及自动驾驶技术领域，包括：获取目标场景的RGB图像；利用预先训练完成的骨干网络对RGB图像进行处理，得到第一图像特征图；利用预先训练完成的动态深度网络对第一图像特征图进行处理，得到语义特征图和深度分布图；将语义特征图和深度分布图进行相乘，得到第二图像特征图；利用体素池化对第二图像特征进行处理，得到BEV特征图；利用检测头对BEV特征图进行处理，得到3D目标检测结果。本申请提高了多场景的目标检测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及自动驾驶，尤其是涉及一种面向灯塔认知多场景鲁棒的视觉3d目标检测方法。

技术介绍

1、视觉3d目标检测在自动驾驶系统中起着至关重要的作用，它可以帮助自动驾驶车辆感知周围环境，准确识别和定位障碍物等信息。但不同的天气条件会导致图像的对比度和清晰度不同，不同的地理环境会导致图像中检测数据分布不同，因此单一视觉3d检测模型只能应对一个场景，自动驾驶汽车需要整合多个感知模型来实现全面的场景感知能力，从而拓展自动驾驶感知能力。但这种做法需要更多的软件和硬件资源，增加了汽车系统的复杂性和成本，不同模型之间的参数和设置可能会相互影响，导致系统不稳定。

技术实现思路

1、有鉴于此，本申请提供了一种面向灯塔认知多场景鲁棒的视觉3d目标检测方法，以解决上述技术问题。

2、第一方面，本申请实施例提供一种面向灯塔认知多场景鲁棒的视觉3d目标检测方法，包括：

3、获取目标场景的rgb图像；

4、利用预先训练完成的骨干网络对rgb图像进行处理，得到第一图像特征图；

5、利用预先训练完成的动态深度网络对第一图像特征图进行处理，得到语义特征图和深度分布图；

6、将语义特征图和深度分布图进行相乘，得到第二图像特征图；利用体素池化对第二图像特征进行处理，得到bev特征图；

7、利用检测头对bev特征图进行处理，得到3d目标检测结果。

8、进一步地，所述动态深度网络包括：场景感知鉴别器、语义处理分支和深度处理分支；