一种融合双重注意力机制的单目3D目标检测方法技术

技术编号：37127404 阅读：35 留言：0更新日期：2023-04-06 21:26

一种融合双重注意力机制的单目3D目标检测方法，基于目标检测算法，融合通道注意力机制及空间注意力机制，提供有效聚焦，提升收敛速度，减少时延，可以更好地解决目标检测的精度问题，提高网络的可解释性，同时提升目标检测的性能。通过将通道注意力机制(channel attention)、空间注意力机制(spatial attention)两种注意力机制综合运用，聚焦输入图像的全局与局部的双重重要信息来提高单目3D目标检测的精度。该发明专利技术成本极低、便于推广使用，能够在自动驾驶、障碍物检测与定位中扮演非常重要的角色。演非常重要的角色。演非常重要的角色。

全部详细技术资料下载

【技术实现步骤摘要】
一种融合双重注意力机制的单目3D目标检测方法

[0001]本专利技术属于计算机视觉领域，具体涉及一种融合双重注意力机制的单目3D目标检测方法。

技术介绍

[0002]现阶段，基于深度学习技术的计算机视觉领域是无人驾驶人工智能的一大热门。伴随着无人驾驶技术水平的不断拔高，无人驾驶汽车行业市场规模也迎来了史无前例的快速增长。无人驾驶感知系统构建在激光雷达、毫米波雷达等传感器的共同作用基础上，同时也需要机器视觉感知系统才能构建出一个可以识别交通标志、车道线、周围行人车辆的强大体系。因此，机器视觉是自动驾驶领域不可或缺的一部分，而3D目标检测也正是机器视觉中最为基础也最为关键的一个部分，在自动驾驶中扮演了非常重要的角色，在障碍物检测与定位中也至关重要。
[0003]当前的3D目标检测算法中，基于激光雷达、RGB
‑
D相机的技术成本高昂，作用距离短并且线数再多的激光雷达获取的点云也是稀疏且缺乏纹理信息的，同时双目相机误差较大，不仅要求时间同步、体积较大而且对基线安装有较高要求。相比之下，单目相机价格亲民体积小，功耗低更贴近实际应用需求。与此同时，基于单目视觉的方法要求十分严苛，即只有单个相机的图像作为输入，结合相机标定得到物体的三维检测。显然，该方法难度较大，但成本极低、便于推广使用。因此，研究此类问题极具应用价值和学术挑战性。
[0004]但在3D目标检测的技术飞速发展中也伴随了很多问题。由于实际应用中的图像输入的尺寸较大，而检测时对所有的输入信息进行训练势必会造成精确度和实时性的降低，这样...

【技术保护点】

【技术特征摘要】
1.一种融合双重注意力机制的单目3D目标检测方法，其特征在于：所述方法包括如下步骤：步骤1：读入RGB图片，在主干网络中进行特征的提取；所述主干网路基于包含残差连接的DLA34网络；步骤2：构建全局注意力机制网络，进行特征融合与加强，得到特征图；步骤3：将处理后的特征图输入至各个预测分支处理，得到新局部特征图；步骤4：使用一个卷积注意力机制CBAM模块对预测分支进行处理，以上一步得到的特征图作为模块的输入；步骤5：将各个结果整合并输入至一个卷积核大小为1x1的卷积网络，输出参数结果；步骤6：根据模型输出的参数画出目标对应的3D框图。2.根据权利要求1所述的一种融合双重注意力机制的单目3D目标检测方法，其特征在于：步骤1中，使用摄像头从场景中读取RGB图像，将其输入至已完成构建的模型中。3.根据权利要求1所述的一种融合双重注意力机制的单目3D目标检测方法，其特征在于：步骤2中，使用空间注意力模块在通道维度上进行最大值和平均值的汇聚，将多通道压缩成单通道，然后通过带有注意力权重的卷积提取注意力信息并通过激活函数使得空间注意力权重非负，最终将空间注意力的权重值与原图相乘得到特征图。4.根据权利要求1所述的一种融合双重注意力机制的单目3D目标检测方法，其特征在于：步骤3中，依次进行卷积核大小为3x3的卷积，然后经过一个激活函数层，得到新局部特征图...

【专利技术属性】
技术研发人员：马泽森，付慧，王纯洁，徐鹤，季一木，刘尚东，苏俞彪，徐鑫，张澳生，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人