System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 图像分块自适应gamma校正和改进信赖域的视觉SLAM方法技术_技高网
当前位置: 首页 > 专利查询>南通大学专利>正文

图像分块自适应gamma校正和改进信赖域的视觉SLAM方法技术

技术编号:41353690 阅读:7 留言:0更新日期:2024-05-20 10:06
本发明专利技术提供了一种基于图像分块自适应gamma校正和改进信赖域的视觉SLAM方法,属于计算机视觉、深度学习,用于自主导航的视觉机器人定位方法技术领域。解决了视觉SLAM系统前端匹配精度因光线变化不稳定以及后端迭代算法计算开销过高的问题。其技术方案为:包含以下步骤:步骤一、图像分块后进行自适应gamma校正;步骤二、对极几何约束;步骤三、改进LM迭代算法。本发明专利技术的有益效果为:本发明专利技术通过提高视觉SLAM系统中前端图像匹配的精度来提高位姿跟踪计算的精度,同时在后端采取节约运算消耗的改进LM迭代算法,在不损失精度的情况下减少运算开销。

【技术实现步骤摘要】

本专利技术涉及,尤其涉及一种基于图像分块自适应gamma校正和改进信赖域的视觉slam方法。


技术介绍

1、在视觉slam系统中,前端起到传入相机拍摄图片,筛选关键帧后求解当前位姿的功能。相机传感器每次传入新的帧时都需要将其和之前的帧进行关联约束。前端只被用来进行跟踪和求解当前位姿,并不会产生新的路标点或是改变之前的路标点。

2、然而在现实运行的场景中,相机难免受到环境的影响从而在光线非常强烈或者非常微弱的时候进行拍摄,因此传入的照片中可能出现不利于图像匹配工作的极其复杂的纹理或是非常稀疏的纹理,这对前端的姿态跟踪计算精度造成了非常大的影响。yu等人通过对图像进行金字塔分层采样并对每层单独进行gamma校正后融合校正结果在很大程度上解决了光线变化或者纹理稀疏导致的匹配水平下降的问题,提高了前端的匹配精度。对于其他运动物体造成的影响,目前的主流方法是使用深度学习网络提供的语义信息对特征点进行约束,例如yang等人利用语义信息建立了运动可能性模型,为不同种类的对象分配了不同的初始静态权重值并在整个过程中根据对象的运动情况来调整运动可能性以及动态权重来减少动态特征点的干扰。

3、此外,在后端算法中,lm算法作为当前主流使用的迭代算法也存在一些弊端,它虽然可以保证迭代的收敛性,但是其需要对待估计的参数求偏导,所以需要占用较多的计算资源,不利于大规模的求解。zhichao ye等人通过使用多项式等效替代,使用雅可比矩阵中包含核心信息的六维,精简雅可比矩阵冗余的三维的方法大幅节约了计算开销,在保证精度的情况下提高了系统的实时性。

4、如何解决上述问题,保证slam系统在动态环境下的准确度和鲁棒性是本专利技术主要的课题。


技术实现思路

1、本专利技术的目的在于提供一种基于图像分块自适应gamma校正和改进信赖域的视觉slam方法,利用提出的分块自适应gamma校正算法提高了前端中图像匹配模块在光线过强和太弱的环境中的匹配精度,在后端利用改进的信赖域算法替换原始的lm算法,在不损失精度的情况下节约了位姿计算的运算开销。整体上,本专利技术提高整个slam算法的精确度同时节约了计算开销。

2、本专利技术思想为:把整个流程分为两个部分,一部分是提高slam系统前端在光线太强或者太弱时候的匹配精度,第二部分是对后端中原始lm迭代算法进行改进,降低其计算开销并且维持原先的位姿计算精度。

3、为了实现上述专利技术目的,本专利技术采用技术方案具体为:一种基于图像分块自适应gamma校正和改进信赖域的视觉slam方法,包含以下步骤:

4、步骤一、图像分块后进行自适应gamma校正

5、gamma校正又称gamma非线性化,被用来针对影像或者图片系统中对于光线的灰度进行非线性的运算和反运算。

6、直接对整幅场景图片使用gamma校正很容易无法还原出足够的细节,这是由于画面整体有明有暗,综合以后图片的变化幅度会相对较小,这依然导致了一部分图像细节的损失。因此我们采用图像先分块后校正的策略来还原场景图片的纹理细节。

7、首先我们有用于图像处理的通用照明校正函数:

8、g(x,y)=(i(x,y)/255)γ×255

9、其中i(x,y)表示位于(x,y)处像素的灰度值,g(x,y)表示该像素经过校正后的灰度值,γ表示校正参数。

10、默认的图像分块策略为将图片分割成5*5共计25块矩形区域分别进行自适应gamma校正。

11、

12、其中,imean为单个图像块的灰度中值,它的值不能是0或255,μ是范围为(0,1)的灰度校正的阈值,本专利技术中参数μ的取值为经验值0.5。

13、步骤二、对极几何约束

14、对极几何约束原理是指在几何问题中,当给定一些点或者线段的极坐标或极角时,可以根据极坐标或者极角之间的关系推导出其他点或线段的极坐标或极角。

15、匹配点对p1,p2转化为齐次坐标形式如下:

16、p1=[u1,v1,1]p2=[u2,v2,1]

17、其中u,v表示匹配关键点的像素坐标,极线li由如下方程决定:

18、

19、其中x,y,z表示线向量,f表示基本矩阵。则匹配点到对应极线的距离可以按照如下公式表示为:

20、

21、由于物体自身可能处于运动状态,图像中的关键点无法准确落在极线上,因此偏移的距离越长,该点处于运动状态的概率就越大。

22、步骤三、改进lm迭代算法

23、lm算法作为高斯牛顿gauss-newton法和最快下降法的融合算法,可以利用迭代的方法同时求解多个由非线性实值函数平方和复合而成的多元复合函数的局部极小值。它的优点在于结合了高斯牛顿法和最快下降法的优势:在当前的解距离局部极小值很远的时候它能够保证持续的收敛,这是最快下降法的优点;在当前解非常靠近局部极小值的时候它和高斯牛顿法一样可以做到迅速地收敛。

24、假设p是向量中的一个点,函数f在p处可微,那么雅可比矩阵j(p)即为该点的导数,此时我们定义一个x,当x足够接近p的时候,将残差函数进行一阶泰勒近似展开可以得到如下:

25、f(x)≈f(p)+j(p)*(x-p)

26、其中雅可比矩阵而它的后一项x-p则被称为迭代步长,我们用δ表示。将残差项代入损失函数可以得到:

27、

28、令上述损失函数一阶导数等于零,则有如下正规方程,其中雅可比矩阵j和海森(hessian)矩阵均具有稀疏性,优化的主要目的就是求解该方程。

29、(jtj)δ=-jtf

30、有上述方程我们可以得到最快下降法的迭代步长δsd可以根据方程δsd=-jtf得到,高斯牛顿法的迭代步长δgn可以通过求解正规方程得到。下一步就是制定两者的最优选择策略。

31、信赖域定义了当前迭代x周围的一个区域,在该区域内信赖模型可以充分的表示出目标函数从而选择合适的迭代步长和方向作为该模型在信赖域内的近似最小值。信赖域算法的最重要步骤之一是在每次迭代时指定选择信赖域半径δ的策略,这一步也同时决定了所选择的迭代步。

32、我们定义了下降比ρ来表示每次迭代以后模型近似的收益情况,其中δ表示迭代的步长,f表示函数f的模型近似函数:

33、

34、设置的更新策略如下:其中u代表阻尼参数,阻尼越大,信赖域半径即迭代步长越小,反之迭代步长越大,收敛过程越快。

35、ρ>0,p=pnew

36、pnew=p+δ{ρ>0.8,δ=min{δ,2.25×||δ||,u=0.25*u}

37、ρ<0.2,δ=0.3×δ,u=2*u

38、由此得到了一个改进的lm迭代算法:当线性近似收益情况较好,即下降比ρ较大时,信赖域半径会适当增大以扩大迭代步长加速收敛,这表现出了高斯牛顿迭代法的优势本文档来自技高网...

【技术保护点】

1.一种基于图像分块自适应gamma校正和改进信赖域的视觉SLAM方法,其特征在于,包含以下步骤:

2.根据权利要求1所述的基于图像分块自适应gamma校正和改进信赖域的视觉SLAM方法,其特征在于,所述步骤一中,采用图像先分块后校正的策略来还原场景图片的纹理细节;

3.根据权利要求1所述的基于图像分块自适应gamma校正和改进信赖域的视觉SLAM方法,其特征在于,所述步骤二中,匹配点对p1,p2转化为齐次坐标形式如下:

4.根据权利要求1所述的基于图像分块自适应gamma校正和改进信赖域的视觉SLAM方法,其特征在于,所述步骤三中,假设p是向量中的一个点,函数F在p处可微,那么雅可比矩阵J(p)即为该点的导数,此时定义一个x,当x接近p的时候,将残差函数进行一阶泰勒近似展开得到如下:

【技术特征摘要】

1.一种基于图像分块自适应gamma校正和改进信赖域的视觉slam方法,其特征在于,包含以下步骤:

2.根据权利要求1所述的基于图像分块自适应gamma校正和改进信赖域的视觉slam方法,其特征在于,所述步骤一中,采用图像先分块后校正的策略来还原场景图片的纹理细节;

3.根据权利要求1所述的基于图像分块自适应gamma校正和改进信赖域的视觉...

【专利技术属性】
技术研发人员:张晓峰施正阳陶秦魏东
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1