基于LSTM双流卷积神经网络的位姿估计方法、系统及介质技术方案

技术编号：31586108 阅读：22 留言：0更新日期：2021-12-25 11:31

本发明专利技术请求保护一种基于LSTM双流卷积神经网络的位姿估计方法、系统及介质，该方法包括步骤：S1，对彩色图像和深度图像进行预处理，将相邻的两帧彩色图像和深度图像分别进行级联，并且深度图像进一步采用MND编码预处理，最后将彩色图像和深度图像进行归一化处理；S2，将预处理完成的彩色图像和深度图像分别输入双流卷积神经网络的彩色流和深度流进行特征提取；S3，将彩色流输出的rgb feature map和深度流输出的depth feature map进行融合生成新的fusion feature map；S4，将新生成的fusion feature map进行全局均值池化处理；S5，利用LSTM神经网络，通过训练，预测当前位姿。结果表明本文提出的位姿估计模型在运动模糊和光线不足的情况下具有更高的精度和鲁棒性。不足的情况下具有更高的精度和鲁棒性。不足的情况下具有更高的精度和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
基于LSTM双流卷积神经网络的位姿估计方法、系统及介质

[0001]本专利技术属于计算机
，特别是一种LSTM双流卷积神经网络的位姿估计方法。

技术介绍

[0002]工业4.0提出的智能制造是面向产品全生命周期，实现泛在感知条件下的信息化制造。智能制造技术是在现代传感技术、网络技术、自动化技术以及人工智能的基础上，通过感知、人机交互、决策、执行和反馈，实现产品设计过程、制造过程和企业管理及服务的智能化，是信息技术与制造技术的深度融合与集成。室内移动机器人是融合了工业4.0所提出的现代传感技术、网络技术以及自动化技术的代表产物之一。
[0003]移动机器人技术在资源勘探开发、医疗服务、家庭娱乐、军事、航天等领域得到了广泛的应用，例如Auto Guided Vehicle(AGV)、清洁机器人已应用于物流运输和家庭卫生清洁当中。在智能移动机器人中，同时定位和建图(Simultaneous Localization and Mapping,SLAM)是其核心技术。移动机器人的导航过程可以分解成三个模块：定位、建图和路径规划。定位用于确定当前时刻机器人在环境中的位姿状态；建图是将周围环境的局部连续观测信息整合到全局一致的模型当中；路径规划确定了地图中最优导航路径。
[0004]当下能够模拟人推理、判断和记忆的人工智能技术在各方面得到了广泛的应用，例如人脸识别、物体分类等。与深度学习技术在人脸识别领域的应用类似，基于特征点法的视觉里程计也需要检测、匹配和筛选特征点。因此将深度学习技术应用到SLAM的视觉里...

【技术保护点】

【技术特征摘要】
1.一种基于LSTM双流卷积神经网络的位姿估计方法，其特征在于，包括以下步骤：S1，对RGB
‑
D相机采集到的彩色图像和深度图像进行预处理，将相邻的两帧彩色图像和深度图像分别进行级联，并且深度图像采用最小化法线+深度法MND编码预处理，最后将彩色图像和深度图像进行归一化处理；S2，将预处理完成的彩色图像和深度图像分别输入双流卷积神经网络的彩色流和深度流进行特征提取；S3，将彩色流输出的彩色特征图谱rgb feature map和深度流输出的深度特征图谱depth feature map进行融合生成新的融合特征图谱fusion feature map；S4，将新生成的fusion feature map进行全局均值池化处理；S5，利用LSTM神经网络，通过训练，预测当前位姿。2.根据权利要求1所述的一种基于LSTM双流卷积神经网络的位姿估计方法，其特征在于，所述彩色图像预处理具体为，将彩色图像的相邻帧进行级联生成640
×
960尺寸的彩色图像；所述的深度图像预处理具体为，首先将深度图像进行MND编码处理，缩放深度图像的宽和高为n
x
和n
y
，将深度d作为图像的第三个通道，对于缩放后的曲面法线[n
x
,n
y
,d]满足然后将深度图像的相邻帧进行级联生成640
×
960尺寸的深度图像。3.根据权利要求1所述的一种基于LSTM双流卷积神经网络的位姿估计方法，其特征在于，所述步骤S2将预处理完成的彩色图像和深度图像分别输入双流卷积神经网络的彩色流和深度流进行特征提取，具体为：采用双流卷积神经网络架构，彩色流和深度流的结构一致都由5层卷积层组成，提取图像中不同层次的特征，前四层都有ReLU激活单元；将预处理好的彩色图像I
rgb
作为彩色流的输入，将预处理好的深度图像I
depth
作为深度流输入，通过卷积运算分别得到彩色特征图谱和深度结构特征图谱。4.根据权利要求1
‑
3任一项所述的一种基于LSTM双流卷积神经网络的位姿估计方法，其特征在于，所述双流卷积神经网络采用并行的结构，而并行结构的每个分支都由五个卷积层组成，每个分支的前四个卷积层都经过ReLU激活单元，其公式表示为：f(x)＝max(0,x)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)其中，x是输入，f(x)是经过ReLU单元之后的输出。5.根据权利要求4所述的一种基于LSTM双流卷积神经网络的位姿估计方法，其特征在于，所述步骤S3将彩色流输出的彩色特征图谱rgb feature map和深度流输出的深度特征图谱depth feature map进行融合生成新的融合特征图谱fusion feature map具体为：将两个数据流网络中conv5输出的feature map合并起来组成新的fusion feature map，再经过批量归一化和ReLU非线性激活单元后进行全局均值池化处理，生成的融合特征表示为：其中，X
k
是fusion feature map，是rgb feature map,是depth feature map。6.根据权利要求5所述的一种基于LSTM双流卷积神经网络的位姿估计方法，其特征在于，所述步骤S5利用LSTM神经网络...

【专利技术属性】
技术研发人员：罗元，曾勇超，胡章芳，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人