视觉定位方法、装置、设备及介质制造方法及图纸

技术编号：44063893 阅读：9 留言：0更新日期：2025-01-17 16:03

本公开提供了一种视觉定位方法、装置、设备及存储介质，所述方法包括：当多目相机在当前时刻采集到多个当前图像时，确定多个当前图像分别对应的第一全局描述子；对多个当前图像分别对应的第一全局描述子进行拼接，确定多目相机在当前时刻的第一全局拼接描述子；获取目标场景对应的视觉稀疏地图，视觉稀疏地图包含多目相机在不同历史时刻分别对应的第二全局拼接描述子；基于第一全局拼接描述子和不同历史时刻分别对应的第二全局拼接描述子，从多目相机在不同历史时刻分别采集的多个历史图像中，确定与多个当前图像匹配的多个历史目标图像；基于多个当前图像和多个历史目标图像，确定局部场景在目标场景的场景位姿数据，速度快、成本低且精度高。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及视觉定位，尤其涉及一种视觉定位方法、装置、设备及介质。

技术介绍

1、在虚拟现实(virtual reality，vr)、自动驾驶、机器人导航等很多领域，都需要使用视觉定位技术进行定位。例如，当用户佩戴vr眼镜时，需要实时定位用户看到的局部场景在真实场景中的位姿，并基于局部场景在真实场景中的位姿，对用户所看到的局部场景进行渲染，使得用户观看局部场景的渲染图像。

2、目前的视觉定位的方法一般是，通过单目相机采集场景图像，并基于单目相机采集的场景图像进行建图，从而得到已构建的场景图像，然后对已构建的场景图像进行关键帧提取以及特征匹配，并结合即插即用(perspective-n-point，pnp)技术进行位姿计算，从而实现视觉定位。然而，基于单目相机的定位方式，精度较低，不能满足高精度的视觉定位需求。因此，提出一种高精度的视觉定位方法，是目前亟需解决的技术问题。

技术实现思路

1、为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种视觉定位方法、装置、设备及介质。

2、第一方面，本公开提供了一种视觉定位方法，所述方法包括：

3、当多目相机在当前时刻采集到多个当前图像时，确定所述多个当前图像分别对应的第一全局描述子，其中，所述多个当前图像对应的场景是目标场景中的局部场景；

4、对所述多个当前图像分别对应的第一全局描述子进行拼接，确定所述多目相机在所述当前时刻的第一全局拼接描述子；

5、获取所述目标场景对

6、基于所述第一全局拼接描述子和所述不同历史时刻分别对应的第二全局拼接描述子，从所述多目相机在所述不同历史时刻分别采集的所述多个历史图像中，确定与所述多个当前图像匹配的多个历史目标图像；

7、基于所述多个当前图像和所述多个历史目标图像，确定所述局部场景在所述目标场景的场景位姿数据。

8、第二方面，本公开提供了一种视觉定位装置，所述装置包括：

9、第一确定模块，用于当多目相机在当前时刻采集到多个当前图像时，确定所述多个当前图像分别对应的第一全局描述子，其中，所述多个当前图像对应的场景是目标场景中的局部场景；

10、拼接模块，用于对所述多个当前图像分别对应的第一全局描述子进行拼接，确定所述多目相机在所述当前时刻的第一全局拼接描述子；

11、获取模块，用于获取所述目标场景对应的视觉稀疏地图，其中，所述视觉稀疏地图预先对所述多目相机在不同历史时刻分别采集的多个历史图像进行建图得到，并且，所述视觉稀疏地图包含所述多目相机在不同历史时刻分别对应的第二全局拼接描述子；

12、第二确定模块，用于基于所述第一全局拼接描述子和所述不同历史时刻分别对应的第二全局拼接描述子，从所述多目相机在所述不同历史时刻分别采集的所述多个历史图像中，确定与所述多个当前图像匹配的多个历史目标图像；

13、定位模块，用于基于所述多个当前图像和所述多个历史目标图像，确定所述局部场景在所述目标场景的场景位姿数据。

14、第三方面，本公开提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现上述的方法。

15、第四方面，本公开提供了一种设备，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现上述的方法。

16、第五方面，本公开提供了一种计算机程序产品，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现上述的方法。

17、本公开实施例提供的技术方案与现有技术相比至少具有如下优点：

18、本公开实施例提供了一种视觉定位方法、装置、设备及介质，该方法包括：当多目相机在当前时刻采集到多个当前图像时，确定多个当前图像分别对应的第一全局描述子，其中，多个当前图像对应的场景是目标场景中的局部场景；对多个当前图像分别对应的第一全局描述子进行拼接，确定多目相机在当前时刻的第一全局拼接描述子；获取目标场景对应的视觉稀疏地图，其中，视觉稀疏地图预先对多目相机在不同历史时刻分别采集的多个历史图像进行建图得到，并且，视觉稀疏地图包含多目相机在不同历史时刻分别对应的第二全局拼接描述子；基于第一全局拼接描述子和不同历史时刻分别对应的第二全局拼接描述子，从多目相机在不同历史时刻分别采集的多个历史图像中，确定与多个当前图像匹配的多个历史目标图像；基于多个当前图像和多个历史目标图像，确定局部场景在目标场景的场景位姿数据。通过上述方式，能够利用多目相机在当前时刻的第一全局拼接描述子和多目相机在不同历史时刻分别对应的第二全局拼接描述子，来确定具有匹配关系的多个历史目标图像和多个当前图像，以进行视觉定位，这样，快速、低成本的实现了基于多目相机的视觉定位，同时提高了视觉定位的精度。

本文档来自技高网...

【技术保护点】

1.一种视觉定位方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对所述多个当前图像分别对应的第一全局描述子进行拼接，确定所述多目相机在所述当前时刻的第一全局拼接描述子，包括：

3.根据权利要求1所述的方法，其特征在于，所述视觉稀疏地图还包括所述多个历史图像分别对应的第二全局描述子；所述方法还包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述第一全局拼接描述子和所述不同历史时刻分别对应的第二全局拼接描述子，从所述多目相机在所述不同历史时刻分别采集的所述多个历史图像中，确定与所述多个当前图像匹配的多个历史目标图像，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于所述多个当前图像和所述多个历史目标图像，确定所述局部场景在所述目标场景的场景位姿数据，包括：

6.根据权利要求5所述的方法，其特征在于，所述将每目相机采集的当前图像中的二维特征点与每目相机采集的历史目标图像中的三维特征点进行匹配，得到每目相机的匹配点对，包括：

7.根据权利要求5所述的方法，其特征在于，

8.一种视觉定位装置，其特征在于，所述装置包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有指令，当所述指令在终端设备上运行时，使得所述终端设备实现如权利要求1-7任一项所述的方法。

10.一种设备，其特征在于，包括：存储器，处理器，及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时，实现如权利要求1-7任一项所述的方法。

11.一种计算机程序产品，其特征在于，所述计算机程序产品包括计算机程序/指令，所述计算机程序/指令被处理器执行时实现如权利要求1-7任一项所述的方法。

...

【技术特征摘要】

1.一种视觉定位方法，其特征在于，所述方法包括：

3.根据权利要求1所述的方法，其特征在于，所述视觉稀疏地图还包括所述多个历史图像分别对应的第二全局描述子；所述方法还包括：

6.根据权利要求5所述的方法，其特征在于，所述将每目相机采集的...

【专利技术属性】
技术研发人员：彭树学，
申请(专利权)人：北京字跳网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人