一种用于矢量高清地图构建的流查询去噪方法技术

技术编号：44353081 阅读：4 留言：0更新日期：2025-02-25 09:37

本发明专利技术涉及自动驾驶技术领域，公开了一种用于矢量高清地图构建的流查询去噪方法，包括：在实例层面上对前一帧的真实信息与当前帧的真实信息进行匹配，建立前一帧的实例与当前帧的实例之间的一一对应关系，并计算当前帧中的每个实例与前一帧中的每个实例之间的倒角距离，得到最小距离值；根据前一帧的真实信息在当前帧中的变换偏差以及所述最小距离值，动态调整噪声的衰减率，基于噪声衰减率，并通过矩形框移位和矩形框缩放来为曲线随机添加噪声，得到有噪声的曲线；将内容嵌入与位置嵌入融合后输入到多层感知机，来获得当前帧的噪声查询；本发明专利技术通过流查询去噪策略，提高了地图元素在不同帧之间的时间一致性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自动驾驶，具体涉及一种用于矢量高清地图构建的流查询去噪方法。

技术介绍

1、基于人工智能和深度学习方法的现代计算机视觉技术在过去10年里取得了显著进展。如今，它被广泛应用于图像分类、物体识别、视频分析、自动驾驶车辆的图像处理等方向。自动驾驶作为一个新兴产业，是当今科技领域的热门课题，也是计算机视觉领域的关键任务，这一技术期望通过各种车载外设，实现算法对汽车的完全自主控制，从而在没有人类驾驶员干预的情况下，安全、高效地完成驾驶任务。自动驾驶技术主要包括感知模块、预测模块和控制模块。在感知模块中，根据车载外设也就是模型输入数据模态的不同，可以划分为基于图像、基于雷达，以及混合模态的自动驾驶技术。目前，自动驾驶技术主要依赖于鸟瞰视图(bird's-eye-view，bev)算法，将多个传感器(如摄像头、雷达、激光雷达等)采集到的数据转换为鸟瞰视角的图像，使得自动驾驶系统能够更直观地理解周围的道路、车辆、行人和其他障碍物。可以分为基于透视的bev和基于深度学习的bev。而以transformer为基础的深度学习bev技术又可以分为基于稀疏query的方法和基于稠密query的方法。

2、近年来，人们非常关注利用自动驾驶车辆中的车载传感器，通过在bev特征后连接一个解码器来构建矢量化本地高清地图。相比于传统的离线slam方法，这些在线方法消除了对测绘车队的需求并减少了人力，同时保持了适应新环境或潜在地图变化的能力，从而节省了成本。这些地图对于自动驾驶车辆至关重要，因为它们包含有关道路的丰富语义信息，从而实现有效导航。

3、目前，国内外的研究者都致力在公开数据集nuscenes和argoverse2上提高模型的性能，取得了显著的进展，如bemapnet，pivotnet，streammapnet等。但是，现有的大多方法忽略了时间信息的整合，无法充分利用时间信息来提高地图构建的准确性和效率。即使是streammapnet，也只是将流范式直接应用于矢量化高清地图(hd-map)的构建，未能充分利用时间信息的固有潜力。

4、因此，针对自动驾驶场景下的矢量化高清地图构建开展工作，研究如何在流范式中进行更加有效的时间建模，具有重要的理论意义和应用价值。

技术实现思路

1、本专利技术针对现有矢量化高清地图构建过程中对于时间序列信息利用不充分的问题，提供一种流查询去噪(stream query denoising，sqd)策略，用于在高清地图构建中增强时间建模，提高地图元素的时间一致性，从而提升矢量化高清地图的构建性能。

2、为解决上述技术问题，本专利技术采用如下技术方案：

3、一种用于矢量高清地图构建的流查询去噪方法，基于streammapnet模型实现，包括以下步骤：

4、步骤一，对于构建地图时所用的数据帧中的曲线，通过将曲线的最小外接矩形框视为实例表示来封装曲线；在实例层面上对前一帧的真实信息与当前帧的真实信息进行匹配，建立前一帧的实例与当前帧的实例之间的一一对应关系，并计算当前帧中的每个实例与前一帧中的每个实例之间的倒角距离，得到最小距离值；

5、步骤二，根据前一帧的真实信息在当前帧中的变换偏差以及所述最小距离值，动态调整噪声的衰减率，基于噪声衰减率，并通过矩形框移位和矩形框缩放来为曲线随机添加噪声η，得到有噪声的曲线；

6、步骤三，将有噪声的曲线对应的实例的点集中各个点的横坐标和纵坐标分别输入到位置编码函数，将得到位置编码结果拼接后输入到多层感知机，得到实例的位置嵌入；其次，为每个类别设置一个可学习的嵌入，即内容嵌入；将内容嵌入与位置嵌入融合后输入到多层感知机，来获得当前帧的噪声查询；

7、步骤四，将当前帧的多视角图像经过bev编码器得到当前帧的bev特征，将当前帧的bev特征和上一帧的bev特征进行融合，得到融合bev特征；将融合bev特征、地图查询、上一帧的噪声查询以及当前帧的噪声查询输入到transformer解码器，输出一组点的描述作为下一帧地图的预测，m表示下一帧地图的实例数，dm表示下一帧地图中第m个实例的描述。

8、进一步地，步骤一中，所述在实例层面上对前一帧的真实信息与当前帧的真实信息进行匹配，建立前一帧的实例与当前帧的实例之间的一一对应关系，并计算当前帧中的每个实例与前一帧中的每个实例之间的倒角距离，得到最小距离值，具体包括：

9、令和分别表示前一帧，即t-1帧，的真实信息和当前帧，即第t帧，的真实信息；和分别表示表示前一帧第i个实例和当前帧第k个实例的坐标集合，m′和n′分别表示前一帧和当前帧中实例的数量；利用前一帧和当前帧的坐标系之间的变换矩阵t将转换至当前帧，得到转换后的真实信息表示前一帧坐标系转换后第i个实例的坐标集合；计算当前帧的中的每个实例，与前一帧中每个实例之间的倒角距离：

10、

11、其中，cddir(s1，s2)是s1到s2方向上的倒角距离，cd是s1和s2双向倒角距离；s1和s2是曲线上的两个点集；p为点集s1中的一个点，q为点集s2中的一个点；idx表示最接近曲线本身的索引，d是当前帧中的实例与先前帧中所有实例之间的最小的倒角距离，即所述最小距离值。

12、进一步地，步骤二具体包括：

13、根据前一帧真实信息在当前帧中的变换偏差，动态调整噪声的衰减率：每个实例的噪声衰减率rdacay：

14、

15、其中γ是预定义的衰减尺度，w和h表示矩形框的宽度和高度；

16、通过矩形框移位和矩形框缩放来得到有噪声的曲线时，设随机添加的噪声η＝{δx，δy，δw，δh}，δx、δy分别为矩形框随机移位的横坐标δx和纵坐标δy，δw、δh分别为矩形框宽度和高度的变化量，则加噪实例bins表示为

17、bins＝{x，y，w，h}+{δx，δy，δw，δh}·rdecay

18、其中x，y，w，h分别为原始的实例对应的矩形框中心的横坐标和纵坐标、矩形框的宽度和高度；

19、所述加噪实例bins即为有噪声的曲线。

20、进一步地，步骤三具体包括：

21、第m条有噪声的曲线的点集为对应第m个实例，n为点集中的点的数量，点集中的第i个点的位置嵌入为：

22、

23、为点的横坐标和纵坐标，pe为位置编码函数，用于将浮点数映射到维向量，mlp(pt)表示将维向量投影到维的操作；d表示坐标点经过位置编码后的维度数；

24、得到每个点的位置嵌入后，将曲线上所有点的位置嵌入进行拼接和融合，得到实例的位置嵌入posq：

25、

26、mlp(pos)表示将曲线上所有点的位置信息进行融合的操作；

27、通过多层感知机mlp(fuse)将内容嵌入与位置嵌入融合，来获得噪声查询qdenoise：

28、qdenoise＝mlp(fuse)(concat(cq，posq)本文档来自技高网...

【技术保护点】

1.一种用于矢量高清地图构建的流查询去噪方法，基于StreamMapNet模型实现，其特征在于，包括以下步骤：

2.根据权利要求1所述的用于矢量高清地图构建的流查询去噪方法，其特征在于，步骤一中，所述在实例层面上对前一帧的真实信息与当前帧的真实信息进行匹配，建立前一帧的实例与当前帧的实例之间的一一对应关系，并计算当前帧中的每个实例与前一帧中的每个实例之间的倒角距离，得到最小距离值，具体包括：

3.根据权利要求1所述的用于矢量高清地图构建的流查询去噪方法，其特征在于，步骤二具体包括：

4.根据权利要求1所述的用于矢量高清地图构建的流查询去噪方法，其特征在于，步骤三具体包括：

【技术特征摘要】

1.一种用于矢量高清地图构建的流查询去噪方法，基于streammapnet模型实现，其特征在于，包括以下步骤：

2.根据权利要求1所述的用于矢量高清地图构建的流查询去噪方法，其特征在于，步骤一中，所述在实例层面上对前一帧的真实信息与当前帧的真实信息进行匹配，建立前一帧的实例与当前帧的实例之间的一...

【专利技术属性】
技术研发人员：赵峰，赵一鸣，王硕，
申请(专利权)人：中国科学技术大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人