人工智能设备、视觉定位方法、装置及可读存储介质制造方法及图纸

技术编号：31094543 阅读：18 留言：0更新日期：2021-12-01 13:03

本发明专利技术涉及人工智能领域，提供一种人工智能设备、视觉定位方法、装置及可读存储介质。本发明专利技术通过取自然场景中的文字信息，进而获取到场景中的平面信息，在此基础上基于文字平面信息的重投影误差和光度误差进行视觉定位。一方面为视觉系统增加了一种更高级语义特征，在点线特征缺乏但存在文字信息的区域视觉系统仍然可以稳定定位，提高了视觉定位系统的场景适应性和鲁棒性。另一方面，文字信息特征相比于传统点、线特征而言，对于弱纹理、快速运动、运动模糊的情况具备更好的抵抗力，因此引入文字信息有助于提高定位系统对于运动模糊、快速运动的稳定性。动的稳定性。动的稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
人工智能设备、视觉定位方法、装置及可读存储介质

[0001]本专利技术涉及人工智能领域，尤其涉及一种人工智能设备、视觉定位方法、装置及可读存储介质。

技术介绍

[0002]随着人工智能技术的爆发，各种可自动行驶的人工智能设备的研发与落地也得到了广泛的关注。定位技术作为人工智能设备的核心技术，其相关的学术研究与实践落地也得到了广泛的研究与挖掘。
[0003]近年来，基于视觉的室内定位技术取得了较大的进展。视觉定位技术也由于其采用的相机传感器价格相对低廉，采集的数据信息量大可以较为鲁棒的完成感知、重定位等工作需求的原因，迅速得到学术界和产业界的广泛研究与运用。但是基于纯视觉的定位方案一般都主要提取视觉点特征、线特征等低级别的视觉特征来进行定位，这类低级别的视觉特征在用于对弱纹理、快速运动、模糊运动定位时的稳定性比较差。

技术实现思路

[0004]本专利技术所要解决的技术问题为如何提升对于弱纹理、快速运动、模糊运动的准确定位。
[0005]第一方面，本专利技术实施例提供了一种人工智能设备，所述人工智能设备可自动行进，包括相机、存储器和处理器；所述相机用于拍摄所述人工智能设备当前所处场景的图像组；所述存储器存储有可执行程序代码；所述处理器用于调用并运行所述可执行程序代码来实现视觉定位方法；所述视觉定位方法包括：通过所述相机所拍摄的图像组得到所述人工智能设备的位姿信息；当检测到所述图像组中有图像包含文字信息时，建立所述文字信息所在区域的初始平面方程，所述初始平面方程中包含平面参数；利用所述平面参...

【技术保护点】

【技术特征摘要】
1.一种人工智能设备，其特征在于，所述人工智能设备可自动行进，包括相机、存储器和处理器；所述相机用于拍摄所述人工智能设备当前所处场景的图像组；所述存储器存储有可执行程序代码；所述处理器用于调用并运行所述可执行程序代码来实现视觉定位方法；所述视觉定位方法包括：通过所述相机所拍摄的图像组得到所述人工智能设备的位姿信息；当检测到所述图像组中有图像包含文字信息时，建立所述文字信息所在区域的初始平面方程，所述初始平面方程中包含平面参数；利用所述平面参数对所述文字信息所在区域中的地图点特征进行投影预测，并计算投影预测过程中所产生的重投影误差；对所述文字信息所在区域进行投影预测，并于所述文字信息所在区域中选取若干角点，利用所述若干角点构造出所述文字信息所在区域的光度误差；将所述重投影误差与所述光度误差以各自对应的权重系数进行加权运算得到约束残差，利用所述约束残差优化所述位姿信息，并使用优化后的位姿信息进行视觉定位。2.如权利要求1所述的人工智能设备，其特征在于，所述图像组包括两帧图像；所述建立所述文字信息所在区域的初始平面方程，包括：根据所述两帧图像中所述文字信息所在区域内的特征点在图像坐标系下的位置参数，以及相机在拍摄所述两帧图像时的人工智能设备位姿的相对关系，来建立所述文字信息所在区域的初始平面方程。3.如权利要求2所述的人工智能设备，其特征在于，所述根据所述两帧图像中所述文字信息所在区域内的特征点在图像坐标系下的位置参数，以及相机在拍摄所述两帧图像时的人工智能设备位姿的相对关系，来建立所述文字信息所在区域的初始平面方程，包括：根据下述公式建立所述文字信息所在区域的初始平面方程：；其中，是图像坐标系下特征点的齐次坐标，和分别表示前后两帧图像中的同一个特征点，表示前一帧图像的特征点，表示后一帧图像的特征点，T为矩阵转置符号，R表示从所述图像组选取的两帧图像之间的旋转矩阵，t表示所述两帧图像之间的平移矩阵，θ表示世界坐标系中的所述文字信息所在区域的平面参数，θ=(θ1,θ2,θ3)
T
=n/d，n是文字所在区域的平面的法向量，d是文字所在区域的平面到所述相机的光心的距离，θ1、θ2、θ3分别表示文字所在区域的平面的法向量n的3个方向。4.根据权利要求3所述的人工智能设备，其特征在于，所述利用所述平面参数对所述文字信息所在区域中的地图点特征进行投影预测，并计算投影预测过程中所产生的重投影误差，包括：采用下述公式对所述文字信息所在区域中的地图点特征进行投影预测，得到各地图点特征的预测坐标：；
；其中，和分别表示地图点特征的预测坐标，为地图点特征投影的x方向像素，为地图点特征投影的y方向像素；r1表示旋转矩阵R的第一行行向量，r2表示旋转矩阵R的第二行行向量，r3表示旋转矩阵R的第三行行向量；t1表示平移矩阵t的第一行行向量，t2表示平移矩阵t的第二行行向量，t3表示平移矩阵t的第三行行向量；将各地图点特征的预测坐标与各自对应的角点坐标作差，得到所述重投影误差。5.根据权利要求1所述的人工智能设备，其特征在于，所述图像组包括两帧图像；所述对所述文字信息所在区域进行投影预测，并于所述文字信息所在区域中选取若干角点，利用所述若干角点构造出所述文字信息所在区域的光度误差，包括：对所述文字信息所在区域的四个顶点进行投影，确定出区域范围；从所述区域范围内选取若干角点；计算各角点分别在所述两帧图像中对应坐标处的像素的灰度值之差，并作为各角点的光度误差；将所述若干角点的光度误差之和作为所述文字信息所在区域的光度误差。6.根据权利要求1所述的人工智能设备，其特征在于，所述利用所述约束残差优化所述位姿信息，并使用优化后的位姿信息进行视觉定位包括：利用所述约束残差对所述位姿信息、所述文字信息所在区域的初始平面方程进行优化；根据优化后的位姿信息，以及优化后的所述平面参数进一步三角化地图点的逆深度；根据三角化后的逆深度进行视觉定位。7.一种视觉定位装置，其特征在于，所述视觉定位装置应用于可自动行进的人工智能设备中，所述人工智能设备包括相机，所述相机用于拍摄所述人工智能设备当前所处场景的图像组；所述视觉定位装置包括：位姿计算模块，用于通过所述相机所拍摄的图像组计算得到所述人工智能设备的位姿信息；文字信息检测模块，用于检测到所述图像组中是否有图像包含文字信息；平面方程建立模块，用于当所述文字信息检测模块检测到所述图像组中有图像包含文字信息时，建立所述文字信息所在区域的初始平面方程，所述初始平面方程中包含平面参数；重投影...

【专利技术属性】
技术研发人员：刘运航，闫瑞君，谭嘉豪，周阳，陈美文，
申请(专利权)人：深圳市普渡科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人