基于多尺度ROI投影的物体检测任务BEV特征提取方法及系统技术方案

技术编号：38681496 阅读：10 留言：0更新日期：2023-09-02 22:53

本发明专利技术公开了基于多尺度ROI投影的物体检测任务BEV特征提取方法及系统，属于机器视觉技术领域。该方法包括将原始点云进行转换操作得到增强点云，利用3D骨干网络分别对原始点云和增强点云进行BEV特征转换；根据待检测物体的目标尺度将原始BEV特征图和增强BEV特征图划分成多个子区域；计算每个子区域的ROI得分，基于ROI得分确定ROI候选子区域，将对应BEV特征确定为对比学习实例；利用对比实例进行物体检测模型预训练，对预训练模型进行优化更新。本发明专利技术能够使得BEV空间上的ROI区域与物体检测任务更加相关，有利于大场景点云对比学习模型的训练，减少了人工标注成本。减少了人工标注成本。减少了人工标注成本。

全部详细技术资料下载

【技术实现步骤摘要】
基于多尺度ROI投影的物体检测任务BEV特征提取方法及系统

[0001]本专利技术涉及机器视觉
，尤其涉及基于多尺度ROI投影的物体检测任务BEV特征提取方法及系统。

技术介绍

[0002]激光雷达传感器可以提供比传统二维相机更高的定位精度，使其成为自动驾驶视觉感知系统的一种理想的补充。基于激光雷达的三维(3D)物体检测可以从原始激光雷达点云中估计出物体的位置、方向和语义类别，近年来在产业中得到了广泛应用。
[0003]然而，室外激光雷达点云具有稀疏性、遮挡和分布不均等自然属性。使得从大场景点云中进行物体检测是存在挑战性的。在近年来公开的大规模自动驾驶数据集(如Waymo、nuScenes和KITTI等)的基础上，基于激光雷达点云的3D检测任务取得了巨大进展。然而，传统的3D检测器都是建立在足够规模的标注数据之上的。尽管随着激光雷达的普及，3D数据采集变得更加容易，但大规模点云数据的精准标注则需要耗费大量人工成本和时间成本。而且即使采用这种高成本的标注数据进行3D检测器的训练，不同地理环境或不同传感器配置所导致的雷达数据域差异也会导致在一个数据集上训练的检测器通常在另一个数据集上表现欠佳。因此，如何从大量未标注的室外点云数据中学习到具有泛化性、迁移性的点云特征，从而提高物体检测精度，是实现自动驾驶的安全性的关键问题。
[0004]为了高效利用大规模未标注数据，自监督学习提供了一种可行的技术方案。目前，面向大场景点云的自监督学习通常有两种范式，即基于重构的方法和基于对比学习的方法。理想的自监督学习...

【技术保护点】

【技术特征摘要】
1.一种基于多尺度ROI投影的物体检测任务BEV特征提取方法，其特征在于，包括：将原始点云进行转换操作得到增强点云，利用3D骨干网络分别对所述原始点云和所述增强点云进行BEV特征转换，得到原始BEV特征图和增强BEV特征图；根据待检测物体的目标尺度，将原始BEV特征图和增强BEV特征图划分成多个子区域，所述子区域的大小与所述目标尺度正相关；计算每个子区域的ROI得分，基于所述ROI得分，从所述子区域中确定ROI候选子区域，将所述ROI候选子区域对应的BEV特征确定为对比学习中的对比实例；利用所述对比实例进行物体检测模型预训练，确定所述物体检测模型的联合损失函数，并基于所述联合损失函数对预训练的模型进行优化更新。2.根据权利要求1所述的基于多尺度ROI投影的物体检测任务BEV特征提取方法，其特征在于，所述计算每个子区域的ROI得分，基于所述ROI得分，从所述子区域中确定ROI候选子区域，进一步包括：将所述原始BEV特征图和增强BEV特征图中分别输入投影层和全连接层，得到每个子区域的ROI得分，分别形成原始得分图和增强得分图(S
o
，S
a
)，获取所述得分图(S
o
，S
a
)中最大的K个ROI得分对应的子区域，作为所述ROI候选子区域，其中K为预定义的候选子区域数量。3.根据权利要求2所述的基于多尺度ROI投影的物体检测任务BEV特征提取方法，其特征在于，所述确定所述物体检测模型的联合损失函数，进一步包括：计算所述原始得分图和增强得分图(S
o
，S
a
)之间的二元交叉熵损失，作为ROI损失函数：L
ROI
＝BCE(S
o
，S
a
)；根据所述对比实例计算对比损失函数L
CL
：其中为所述原始BEV特征图中的对比实例，为所述原始BEV特征图中的对比实例，为预测器对的预测后的实例；根据所述ROI损失函数和对比损失函数来计算所述联合损失函数：Loss＝αL
ROI
+βL
CL
；其中α，β为所述联合损失函数的平衡参数。4.一种基于多尺度ROI投影的物体检测任务BEV特征提取系统，其特征在于，包括：BEV特征提取模块，用于将原始点云进行转换操作得到增强点云，利用3D骨干网络分别对所述原始点云和所述增强点云进行BEV特征转换，得...

【专利技术属性】
技术研发人员：唐路路，韩乔岳，崔玉峰，黄铁军，
申请(专利权)人：北京智源人工智能研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人