基于双分支抗噪声卷积的多模态三维目标检测方法技术

技术编号：42818875 阅读：28 留言：0更新日期：2024-09-24 20:57

本发明专利技术公开了基于双分支抗噪声卷积的多模态三维目标检测方法，具体按以下步骤实施：步骤1，点云数据预处理；步骤2，构建基于场景重要性预测的抗噪声稀疏卷积块；步骤3，构建BEV空间通道双单元交叉融合模块；步骤4，构建动态自注意力融合的特征细化块；本发明专利技术设计了一种联合2D和3D稀疏卷积的抗噪声卷积主干PNRB，降低了图像深度补全带来的噪声、边界模糊和密度等问题，同时利用体素重要性筛选卷积计算方法提高了三维目标检测的精度和推理速度，解决了现有检测方法检测精度不足，图像融合边缘结果差的问题，检测精度超过大多数方法，检测速度大幅提升。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于三维目标检测方法，涉及基于双分支抗噪声卷积的多模态三维目标检测方法。

技术介绍

1、三维目标检测是点云处理的基础任务之一，其目的是在三维场景中通过激光雷达生成的点云图像来定位和识别三维物体，在自动驾驶等现实应用中，三维目标检测起着至关重要的作用。

2、基于图像和点云图融合的三维目标检测方法按照数据融合的方式分为后融合和前融合两种。后融合对图像和点云两种数据分别采用不同主干网络进行特征提取，后将两种模态的特征提取结果融合在一起。而前融合是先将相机图像和点云的原始数据进行融合，形成新的数据表示，然后直接使用融合后的数据进行目标检测，这两种方式都存在噪声和不一致性问题，且现有检测方法存在检测精度不足、图像融合边缘结果差等问题，因此如何处理不同传感器数据中的噪声和不一致性，以保证融合后数据的质量和准确性是亟须解决的难题。

技术实现思路

1、本专利技术的目的是提供基于双分支抗噪声卷积的多模态三维目标检测方法，解决了现有检测方法检测精度不足的问题。

2、本专利技术所采用的技术方案是，基于双分支抗噪声卷积的多模态三维目标检测方法，具体按以下步骤实施：

3、步骤1，点云数据预处理；

4、步骤2，构建基于场景重要性预测的抗噪声稀疏卷积块；

5、步骤3，构建bev空间通道双单元交叉融合模块；

6、步骤4，构建动态自注意力融合的特征细化块。

7、本专利技术的特点还在于：

8、步骤1中采用kitt

9、场景级增强包括随机场景的翻转、绕z轴旋转以及缩放，场景中存在50％的点进行随机翻转；场景围绕z轴随机旋转，随机值从如式(1)所示；随机进行场景缩放，随机因子为[0.95,1.05]；

10、v'＝cos(θ)v+(1-cos(θ))(u·v)u+sin(θ)(u×v)(1)

11、式中v'为输出向量，v输入点云特征向量，u为旋转轴，θ为旋转角度；

12、对象级增加为转换来自其他场景的对象。

13、步骤2具体按照以下步骤实施：

14、步骤2.1对构建层级随机体素丢弃模块

15、以距离为基础，构建选择区间，根据不同的距离将输入体素划分为mb个区间；以30米为阈值，大于30m的远距离区间保留内部所有体素，相反对于0m-30m的区间，采用随机方法，筛选固定约1k数量的体素块；在基于区间的采样之后，丢弃大部分的冗余体素，使网络加速，在训练时对每个anconv块上进行体素丢弃，采用15％的丢弃率，如式(2)所示：

16、pi'＝pi[0:len×(1-rat)](2)

17、式中，pi表示第i层特征的体素索引，len为随机重排后的特征第一维度，rat为第i层的丢弃率；

18、步骤2.2，构建体素重要性选择块

19、在第一层网络子流形稀疏卷积的基础上，增加空特征位置的输出特征的计算，为后续特征提取提供丰富的邻域特征信息，如式(3)所示：

20、kim＝{k|σ(subm3d(fp))≥δ}(3)

21、式中kim表示动态输出结果，fp表示的输特征入，σ(·)表示激活函数sigmoid，δ表示阈值范围，当为0或1时变为常规稀疏卷积或子流形稀疏卷积；

22、步骤2.3，构建抗噪声卷积块(anconv)

23、步骤2.3具体按照以下步骤实施：

24、步骤2.3.1，采用3d和2d子流形稀疏卷积相结合的方法，将稀疏卷积的接受域扩展到二维图像空间，有效区分噪声点而不影响形状信息，给定n个输入体素，由三维坐标向量x∈rn×3和特征向量t∈rn×c表示，anconv在三维空间中编码空间几何特征，对于t中的每个特征ti，通过两层三维子流形稀疏卷积subs3d对几何特征的体素数进行编码，根据其附近的3×3×3邻域内的非空体素来计算特征，单层过程如式(4)所示：

25、

26、式中，ti3d表示通过三维子流形稀疏卷积subs3d得到的特征，表示根据坐标生成的3×3×3邻域特征，bn(·)为激活函数，cin为输入通道数；

27、步骤2.3.2，通过两层三维子流形稀疏卷积subs3d得到的特征ti3d，根据体素化参数将3d索引转换为一组网格点，然后根据数据增强参数将网格点向后转换为原始坐标系，最后根据lidar和相机的校准参数将网格点投影到2d图像平面上得到2d特征和索引，使对于2d特征用2d子流形稀疏卷积subs2d通过3×3相邻域编码特征，如果在单个二维邻居体素中存在多个特征，使用最大池化保留一个特征来进行二维卷积，总体计算过程如式(5)所示：

28、

29、式中，表示根据坐标生成的3×3邻域体素特征，bn表示非线性激活函数，cin表示输入通道数；

30、步骤2.3.3，在三维和二维特征编码后，将ti3d和ti2d连接起来，得到抗噪声特征向量tifin，如式(6)所示：

31、tifin＝rf(concat(ti3d,ti2d))(6)

32、式中，rf表示将3d特征恢复为3d张量。

33、步骤3具体按以下步骤实施：

34、步骤3.1，构建2d卷积组成的空间特征提取层；

35、步骤3.2，构建2d卷积组成的语义特征提取层，将空间特征提取层获取特征送入语义特征提取层；

36、步骤3.3，构建轻量级空间注意力，编码更精细、具有层次的局部密集空间信息；

37、步骤3.4，采用上采样和解卷积将语义特征图和空间特征图维度恢复一致；

38、步骤3.5，构建交叉注意力融合层，根据权重将两种单元特征自适应融合。

39、步骤3.1中空间特征提取层的第一层为一组3×3卷积和batchnorm(bn)和relu激活函数组层的mlp，输入通道为256，输出通道为64；第二层为四组3×3卷积和batchnorm和relu激活函数组层的mlp，输入通道为64，输出通道为64，如式(7)所示：

40、

41、式中，n是感知机层数，表示每层提取的空间特征。

42、步骤3.2中语义特征提取层的第一层为一组3×3卷积和batchnorm和relu激活函数组层的mlp，输入通道为64，输出通道为128；第二层为四组3×3卷积和batchnorm和relu激活函数组层的mlp，输入通道为128，输出通道为128；如式(8)所示：

43、

44、式中，n是感知机层数，表示每层提取的语义特征。

45、步骤3.3具体按以下步骤实施：

46、步骤3.3.1，将特征图按分为多个通道，对单个通道进行注意力操作，获取通道间的关系特征v，如式(9)所示：

47、v＝(u本文档来自技高网...

【技术保护点】

1.基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，具体按以下步骤实施：

2.根据权利要求1所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤1中采用KITT作为数据集，将训练集拆分为训练样本和验证样本，在训练过程中，采用场景级增强和对象级增强两种数据增强策略；

3.根据权利要求1所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤2具体按照以下步骤实施：

4.根据权利要求1所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤3具体按以下步骤实施：

5.根据权利要求4所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤3.1中空间特征提取层的第一层为一组3×3卷积和BatchNorm和ReLU激活函数组层的MLP，输入通道为256，输出通道为64；第二层为四组3×3卷积和BatchNorm和ReLU激活函数组层的MLP，输入通道为64，输出通道为64，如式(7)所示：

6.根据权利要求4所述的基于双分支抗噪声卷积的多模态三维目标检

7.根据权利要求4所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤3.3具体按以下步骤实施：

8.根据权利要求4所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤3.4具体按以下步骤实施：

9.根据权利要求4所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤4具体按照以下步骤实施：

10.根据权利要求9所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤4.1中将第三层和第四层特征用来融合邻域特征，两条主干网络得到的特征分别经过点特征融合模块构建空间信息，每条分支均由多层感知机、线性层和点卷积构成；

...

【技术特征摘要】

1.基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，具体按以下步骤实施：

2.根据权利要求1所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤1中采用kitt作为数据集，将训练集拆分为训练样本和验证样本，在训练过程中，采用场景级增强和对象级增强两种数据增强策略；

3.根据权利要求1所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤2具体按照以下步骤实施：

4.根据权利要求1所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤3具体按以下步骤实施：

5.根据权利要求4所述的基于双分支抗噪声卷积的多模态三维目标检测方法，其特征在于，所述步骤3.1中空间特征提取层的第一层为一组3×3卷积和batchnorm和relu激活函数组层的mlp，输入通道为256，输出通道为64；第二层为四组3×3卷积和batchnorm和relu激活函数组层的mlp，输入通道为64，输出通道为64，如式(7)所示：

6.根据权利要求4所述的基于双...

【专利技术属性】
技术研发人员：宋霄罡，周振华，黑新宏，
申请(专利权)人：西安理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人