一种融合语义信息的激光雷达目标检测方法及系统技术方案

技术编号：29294549 阅读：15 留言：0更新日期：2021-07-17 00:46

本发明专利技术公开了一种融合语义信息的激光雷达目标检测方法及系统，所述方法包括：对每一时间戳下的图像帧进行语义分割处理，获得语义分割分数；在每一帧点云数据中添加相应摄像机坐标下的图像RGB特征；将添加所述图像RGB特征的所述点云数据投影到分割网络的输出中，并将所述语义分割分数附加到所述点云数据中；对附加所述语义分割分数和所述图像RGB特征的所述点云数据进行基于图卷积的目标分类与3D框回归，获得目标位置框和目标类别。解决了现有技术中存在对目标的特征的检测效果不够准确，进而导致对车辆、行人的目标检测不够准确和高效的技术问题。的技术问题。的技术问题。

A lidar target detection method and system based on semantic information fusion

全部详细技术资料下载

【技术实现步骤摘要】
一种融合语义信息的激光雷达目标检测方法及系统

[0001]本专利技术涉及计算机视觉领域相关领域，尤其涉及一种融合语义信息的激光雷达目标检测方法及系统。

技术介绍

[0002]环境感知技术于智能交通、智能穿戴设备、智慧城市等领域有着重要的意义。其中，传感器获取并处理信息是实现环境感知的基础和技术前提，相机获取的图像数据具有固有的深度模糊性，受光线及天气影响较大，但是可以提供细粒度的纹理以及颜色信息；另一方面，激光雷达获取的点云数据提供了非常精确的目标空间位置信息，但是分辨率和纹理信息较弱。为了改善单一传感器造成的检测效果不佳，目前多采用多传感器融合的研究方法从而能够提供丰富且准确的环境信息。
[0003]现有的多传感器融合方法主要分为三类：特征级别融合、决策级别融合以及2D目标框投影点云的two
‑
stage融合。特征级别融合例如Xiaozhi Chen等人提出的MV3D、JasonKu等人提出的AVOD等网络结构，主要是将图像特征与点云特征分流提取，再在特征级别上进行直接级联或者进行特征的多尺度融合。但是这种融合方式最大的缺点在于“特征模糊”，一方面点云的一个点对应图像视图上的多个像素点，另一方面提取的图像特征图与点云特征图中，特征的数量级相差较大，也就造成了实际起作用的特征图中并未很好地利用到小量级的信息；决策级别融合是相对简单的融合方式，例如SuPang等人提出的CLOCs网络，即两种模态的特征不在特征层或者最开始就融合，而是分别进行各自网络的训练推理，分别得到2D和3D检测器下的pro...

【技术保护点】

【技术特征摘要】
1.一种融合语义信息的激光雷达目标检测方法，其中，所述方法包括：对每一时间戳下的图像帧进行语义分割处理，获得语义分割分数；在每一帧点云数据中添加相应摄像机坐标下的图像RGB特征；将添加所述图像RGB特征的所述点云数据投影到分割网络的输出中，并将所述语义分割分数附加到所述点云数据中；对附加所述语义分割分数和所述图像RGB特征的所述点云数据进行基于图卷积的目标分类与3D框回归，获得目标位置框和目标类别。2.如权利要求1所述的方法，其中，所述对每一时间戳下的图像帧进行语义分割处理，获得语义分割分数，包括；将ResNet101作为主网络，通过编码器对所述每一时间戳下的图像帧进行下采样特征提取；对所述每一时间戳下的图像帧通过解码器进行上采样的恢复分辨率处理，获得预测特征图；根据所述预测特征图，获得所述语义分割分数。3.如权利要求1所述的方法，其中，所述在每一帧点云数据中添加相应摄像机坐标下的图像RGB特征，所述方法包括：对于每一帧点云数据，根据点云坐标系到相机坐标系的转换矩阵，将空间点云位置转换到照相机坐标系下的坐标点位置；筛选各相机坐标点中Z轴坐标值大于0.1的点，获得第一索引位置集合；根据所述第一索引位置集合通过照相机坐标系到图像坐标系的转换矩阵，获得到图像坐标系下的坐标值；加载所述点云数据对应的图像帧，获得每个坐标值下的RGB通道数据；将所述RGB通道数据级联至点云特征维度。4.如权利要求3所述的方法，其中，所述将添加所述图像RGB特征的所述点云数据投影到分割网络的输出中，并将所述语义分割分数附加到所述点云数据中，包括：对所述每一时间戳下的图像帧，索引所述分割网络输出的带有所述语义分割分数的各点图像坐标；将对应类别叠加至相应帧中已经过投影到图像坐标系的所述点云数据中。5.如权利要求1所述的方法，其中，所述对附加所述语义分割分数和所述图像RGB特征的所述点云数据进行基于图卷积的目标分类与3D框回归，获得目标位置框和目标类别，包括：对所述点云数据进行基于下采样的图构建；构建图神经网络更新迭代每一个中心点的特征，通过相邻点的状态来改善中心点的状态；定位分支预测每个类别的边界框，如果一个顶点在一个边界框中，计算预测值与groundtruth的Huber损失；如果一个顶点不在所述边界框中或者是非感兴趣类，将其定位损失置为0。6.如权利要求5所述的方法，其中，所述构建图神经网络更新迭代每一个中心点的特征，通过相邻点的状态来改善中心点的状态，公式如下：
其中，定义一个含有N个点的点云图为P＝{p1，...，p
...

【专利技术属性】
技术研发人员：李燕，陈超，齐飞，王晓甜，石光明，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人