一种多视角深度估计方法技术

技术编号:36295201 阅读:17 留言:0更新日期:2023-01-13 10:09
本发明专利技术提供了一种多视角深度估计方法,具体步骤如下:步骤1:图像输入:通过相机获取N+1张不同图像,正视图像和其余方向图像分别作为参考图像I

【技术实现步骤摘要】
一种多视角深度估计方法


[0001]本专利技术属于计算机视觉和深度学习
,具体涉及一种多视角深度估计方法。

技术介绍

[0002]在自动驾驶技术、工业检测、医疗、航天航空、三维重建等诸多领域中,获取图像的深度信息有着重要意义。通过多视图的方法来恢复深度图的技术有着广阔的前景。具体来讲,基于多视图的深度估计方法是将相机采集到物体或者场景的多张不同角度图像,作为深度估计的主要输入信息,再利用计算机视觉的算法,最终生成深度图。
[0003]深度图是将真实场景中的点到相机的距离作为像素值的图像。深度值越小表示真实场景中的点距离相机越近。获取目标场景的深度信息可以分为基于主动式和基于被动式两种方法。基于主动式的深度获取方法是利用较高精度和技术成熟的硬件设备对目标场景获取深度信息,如激光雷达,发射激光利用成熟的TOF(Time of Flight Measurement)测距技术获取目标物体到相机的距离从而得到深度信息。虽然基于主动式的方法获取目标场景的深度信息更为快速、方便、精确,但是这些设备一般非常昂贵,导致深度获取的成本较高。同时对场景的外界环境也有要求,比如光干扰和测距距离都会对测量结果有影响。基于被动式的深度获取方法是利用目标场景图像中的特征点,通过计算机视觉算法理论预测出图像深度信息,整个过程操作简单不需要额外设备,实用性强。但是,基于被动式深度获取方法中主要信息来源是不同视角的图像,拍摄的图像会存在遮挡区域、外界光照反射、不同的光照强度和图像中重复图案的问题,都会对估计目标场景的深度结果产生误差影响。
[0004]基于被动式的深度获取方法中,利用图像求深度估计的方法,一般分为基于传统的计算机视觉算法理论来实现和基于深度学习的网络框架具体实现。
[0005]基于传统多视图深度估计算法流程主要由运动恢复结构(Structure from Motion,SFM)和多视角立体匹配方法(Muti

view Stereo,MVS)组成:
[0006]1、SFM算法:从一组不同视角的二维图像中估计相机运动和目标场景中深度信息。首先提取出图像的特征点,每两张图像进行特征匹配,再通过对极几何重建出匹配的特征点对应的空间点,再利用Bundler Ajustment方法对得到的相机位姿和特征点的空间坐标进行优化,最后不断增加与已得到的空间点匹配点最多的其余图像,继续进行Bundler Ajustment优化。得到所有的空间点后最后进行全局的Bundler Ajustment。SFM算法可以为MVS算法提供相机的位置矩阵以及场景的初始稀疏空间点。
[0007]2、MVS算法:在上述SFM方法计算出的相机位置参数的基础上进行更进一步的稠密重建,输出密集的三维空间点。MVS算法通过点云,深度图,体素多种方式实现。
[0008]传统的深度估计算法使用的特征是人工设计的,在弱纹理的区域下很难提取到特征,导致弱纹理区域深度信息可能预测不准确且前期需要耗费大量人力和时间设计特征。

技术实现思路

[0009]因此,本专利技术要解决的技术问题在于提供一种多视角深度估计方法,能够解决现有的由于采集到的图像存在遮挡问题、弱纹理区域、反射表面,重复图案的情况,传统深度估计方法在这种情况下预测的深度信息不准确或者出现无法预测的问题。为了更精确更快速的获取深度信息,弥补传统深度估计方法的不足提供了一种多视角深度估计方法。
[0010]为了解决上述问题,本专利技术提供了一种多视角深度估计方法,具体步骤如下:
[0011]步骤1:图像输入:通过相机获取N+1张不同图像,正视图像和其余方向图像分别作为参考图像I
i=0
和目标图像I
i
,i的取值范围是0到N;
[0012]步骤2:特征提取:包括FPN网络模块和CA模块两个部分;
[0013]步骤2.1:FPN网络模块是基于步骤1获取的图像,提取不同尺度的初始特征图;
[0014]步骤2.2:将FPN网络模块对输入相机图像进行三个不同尺度的特征提取后,得到的初始特征图,通过DCN模块过渡到CA模块;
[0015]步骤3:深度求精:经过特征提取后得到的不同尺度特征图,要用级联的方式预测出不同分辨率的深度图;
[0016]步骤4:深度优化:利用残差学习网络,将深度求精模块输出的分辨率为W
×
H初始深度图进行细化得到优化后的深度图,使用Focal loss来训练网络模型,根据总损失再通过Adam优化方法对网络模型进行梯度更新,从而引导整个模型的训练。
[0017]可选的,步骤2.2包括CA模块是将特征图沿水平和垂直方向的注意力信息嵌入到通道中,具体步骤如下:
[0018]步骤2.2.1:CA模块将输入特征沿水平和垂直两个方向分别进行全局平均池化,如下公式(1)和公式(2):
[0019][0020][0021]其中,输入张量为X=[x1,x2,

,x
c
]∈R
W
×
H
×
C
,{W,H,C}表示图像宽,高和通道数;分别用W
×
1和1
×
H的两个池化层对通道进行编码,(w,j)和(i,h)分别表示输入张量x
c
的图像坐标位置,为垂直方向h处的第c通道的输出结果,为水平方向w处的第c通道的输出结果;
[0022]步骤2.2.2:沿水平和垂直两个方向的池化层输出结果分别是P
w
和p
h
,接下来进行Concate操作,如下公式(3):
[0023][0024]其中,表示Concate操作,P为Concate操作后输出结果,P
w
为沿水平方向的池化层输出结果,p
h
为沿垂直方向的池化层输出结果;
[0025]步骤2.2.3:将Concate输出结果送入1
×
1卷积层,BN层,Non

line激活函数,求出中间特征图,如下公式(4):
[0026]f=δ(F1×1(P))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0027]其中,P是Concate操作输出结果,F1×1是卷积核大小为1
×
1的卷积变换,δ是非线性激活函数,f是对输入特征图沿水平和垂直方向的空间信息编码后的中间特征图,f∈R
C/r
×
(H+W)
,C为通道数,r为通道缩减率,W和H为图像宽和高;
[0028]步骤2.2.4:将中间特征图f沿水平方向和垂直方向分为两个单独的张量f
w
∈R
C/r
×
W
×
H
和f
h
∈R
C/r
×
W
×
H
,分别利用1
×
1卷积操作,两本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多视角深度估计方法,其特征在于,具体步骤如下:步骤1:图像输入:通过相机获取N+1张不同图像,正视图像和其余方向图像分别作为参考图像I
i=0
和目标图像I
i
,i的取值范围是0到N;步骤2:特征提取:包括FPN网络模块和CA模块两个部分;步骤2.1:FPN网络模块是基于步骤1获取的图像,提取不同尺度的初始特征图;步骤2.2:将FPN网络模块对输入相机图像进行三个不同尺度的特征提取后,得到的初始特征图,通过DCN模块过渡到CA模块;步骤3:深度求精:经过特征提取后得到的不同尺度特征图,要用级联的方式预测出不同分辨率的深度图;步骤4:深度优化:利用残差学习网络,将深度求精模块输出的分辨率为W
×
H初始深度图进行细化得到优化后的深度图,使用Focalloss来训练网络模型,根据总损失再通过Adam优化方法对网络模型进行梯度更新,从而引导整个模型的训练。2.根据权利要求1所述的多视角深度估计方法,其特征在于,步骤2.2包括CA模块是将特征图沿水平和垂直方向的注意力信息嵌入到通道中,具体步骤如下:步骤2.2.1:CA模块将输入特征沿水平和垂直两个方向分别进行全局平均池化,如下公式(1)和公式(2):式(1)和公式(2):其中,输入张量为X=[x1,x2,

,x
c
]∈R
W
×
H
×
C
,{W,H,C}表示图像宽,高和通道数;分别用W
×
1和1
×
H的两个池化层对通道进行编码,(w,j)和(i,h)分别表示输入张量x
c
的图像坐标位置,P
ch
(h)为垂直方向h处的第c通道的输出结果,P
cw
(w)为水平方向w处的第c通道的输出结果;步骤2.2.2:沿水平和垂直两个方向的池化层输出结果分别是P
w
和p
h
,接下来进行Concate操作,如下公式(3):其中,表示Concate操作,P为Concate操作后输出结果,P
w
为沿水平方向的池化层输出结果,p
h
为沿垂直方向的池化层输出结果;步骤2.2.3:将Concate输出结果送入1
×
1卷积层,BN层,Non

line激活函数,求出中间特征图,如下公式(4):f=δ(F1×1(P))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)其中,P是Concate操作输出结果,F1×1是卷积核大小为1
×
1的卷积变换,δ是非线性激活函数,f是对输入特征图沿水平和垂直方向的空间信息编码后的中间特征图,f∈R
C/r
×
(H+W)
,C为通道数,r为通道缩减率,W和H为图像宽和高;步骤2.2.4:将中间特征图f沿水平方向和垂直方向分为两个单独的张量f
w
∈R
C/r
×
W
×
H
和f
h
∈R
C/r
×
W
×
H
,分别利用1
×
1卷积操作,两个单独的张量再通过Sigmoid激活函数处理,求出
水平方向和垂直方向注意力weight,分别为q
w
和q
h
,如公式(5)和公式(6):q
w
=σ(F1×1(f
w
))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)q
h
=σ(F1×1(f
h
))
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(6)其中,q

【专利技术属性】
技术研发人员:魏东刘欢张潇瀚张焱焱
申请(专利权)人:沈阳工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1