一种基于自适应单峰立体匹配成本滤波的双目深度学习方法技术

技术编号：25758590 阅读：22 留言：0更新日期：2020-09-25 21:07

本申请公开了一种基于自适应单峰立体匹配成本滤波的双目深度学习方法，其特征在于：对网络预测的匹配代价直接施加以真实视差为中心的单峰分布监督，实现自适应的匹配成本滤波，包括以下步骤：1)构建数据集，数据集包括左图像和右图像，左图像和右图像作为一个立体图像对；2)以PSMNet作为立体匹配模型基础网络，将立体图像对输入PSMNet立体匹配模型基础网络，PSMNet立体匹配模型基础网络输出三个经过堆积的沙漏3D卷积神经网络聚合后的匹配代价体(Cost Volume)；3)对于每个匹配代价体(Cost Volume)，分别用一个自信度评估网络(Confidence Estimation Network)估计自信度图并用于调节真实的匹配代价体(Ground Truth Cost Volume)，以生成像素级别的单峰分布(Unimodal Distribution)作为网络训练标记。本发明专利技术的优点在于它能克服现有技术的弊端，结构设计合理新颖。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于自适应单峰立体匹配成本滤波的双目深度学习方法
本专利技术涉及一种基于自适应单峰立体匹配成本滤波的双目深度学习方法，属于双目立体匹配视觉图像处理

技术介绍
双目立体视觉通过模仿人类视觉原理来获得丰富的三维立体数据，尤其是深度信息。经过多年的发展，双目立体视觉已经在工业测量、三维重建、无人驾驶等领域发挥了巨大作用。双目立体视觉是基于视差原理并利用成像设备从不同位置获得被测物体的两幅图像，通过计算图像对应点间的位置偏差，来获取物体的三维几何信息的方法。双目立体匹配过程一般包含四个步骤：匹配代价计算，匹配代价聚合，视差图计算，视差图优化。其中匹配代价计算是整个算法的核心部分。传统的立体方法一般采用手工设计的图像特征和代价函数计算匹配代价，由于手工设计本身存在局限性，得到的立体匹配结果抗干扰能力弱，且能应对的场景有限。近年来，许多基于卷积神经网络的立体匹配方法提出将图像特征提取和代价函数学习建模为网络层。比如DispNetC提出利用correlation层作为代价函数的一种趋近，然后通过视差回归损失约束网络学习图像特征提取，由于correlation层计算匹配代价过程丢失过多信息，双目匹配结果精度较低；而GCNet则进一步释放了网络学习图像特征和代价函数的灵活性，提出将左右图特征在通道维度衔接，并且利用一系列三维卷积层学习匹配代价计算，然而端到端的网络设计以视差回归(由softargmin函数回归)损失监督网络学习，对匹配代价计算过程缺乏明确的约束，导致图像特征提取和代价计算函数无法得到有效的学习。<...

【技术保护点】
1.一种基于自适应单峰立体匹配成本滤波的双目深度学习方法，其特征在于：对网络预测的匹配代价直接施加以真实视差为中心的单峰分布监督，实现自适应的匹配成本滤波，包括以下步骤：/n1)构建数据集，数据集包括左图像和右图像，左图像和右图像作为一个立体图像对；/n2)以PSMNet作为立体匹配模型基础网络，将立体图像对输入PSMNet立体匹配模型基础网络，PSMNet立体匹配模型基础网络输出三个经过堆积的沙漏3D卷积神经网络聚合后的匹配代价体(Cost Volume)；/n3)对于每个匹配代价体(Cost Volume)，分别用一个自信度评估网络(ConfidenceEstimation Network)估计自信度图并用于调节真实的匹配代价体(Ground Truth CostVolume)，以生成像素级别的单峰分布(Unimodal Distribution)作为网络训练标记；/n4)提出立体聚焦损失(Stereo Focal Loss)约束估计的匹配代价体和真实的匹配代价体；/n5)通过Soft Argmin函数根据估计的匹配代价体生成亚像素的视差图，并且使用一个回归的L

【技术特征摘要】
1.一种基于自适应单峰立体匹配成本滤波的双目深度学习方法，其特征在于：对网络预测的匹配代价直接施加以真实视差为中心的单峰分布监督，实现自适应的匹配成本滤波，包括以下步骤：
1)构建数据集，数据集包括左图像和右图像，左图像和右图像作为一个立体图像对；
2)以PSMNet作为立体匹配模型基础网络，将立体图像对输入PSMNet立体匹配模型基础网络，PSMNet立体匹配模型基础网络输出三个经过堆积的沙漏3D卷积神经网络聚合后的匹配代价体(CostVolume)；
3)对于每个匹配代价体(CostVolume)，分别用一个自信度评估网络(ConfidenceEstimationNetwork)估计自信度图并用于调节真实的匹配代价体(GroundTruthCostVolume)，以生成像素级别的单峰分布(UnimodalDistribution)作为网络训练标记；
4)提出立体聚焦损失(StereoFocalLoss)约束估计的匹配代价体和真实的匹配代价体；
5)通过SoftArgmin函数根据估计的匹配代价体生成亚像素的视差图，并且使用一个回归的L1损失监督估计的视差图和真实的视差图。

2.根据权利要求1所述的基于自适应单峰立体匹配成本滤波的双目深度学习方法，其特征在于：在步骤2)中进行真实单峰匹配代价分布生成，即对参考图像中的每个像素点p，都会在目标图像的同一极线上搜索一系列待匹配的像素点，匹配代价体反应的是待匹配像素对的相似性，真实的匹配对之间的匹配代价应该是最小的，而其他参数视差值的匹配代价应该随着和真实视差的距离而增加；每个像素的匹配代价分布都应该以真实视差为中心。

3.根据权利要求1所述的基于自适应单峰立体匹配成本滤波的双目深度学习方法，其特征在于：在步骤3)中，构造一个自信度评估网络估计由主干网络预测的匹配代价的自信度，自信度评估网络根据网络的学习难度自适应调整单峰分布的平缓度，即自适应调整单峰分布单峰分布的方差。

4.根据权利要求1所述的基于自适应单峰立体匹配成本滤波的双目深度学习方法，其特征在于：在步骤4)中，进行立体聚焦损失计算，匹配代价体为每个像素点都构建了D个匹配代价{C0，C1，···CD-1}，即匹配代价分布；对于像素点p，对估计的匹配代价分布和真实的匹配代价分布Pp(d)利用交叉熵损失衡量估计的匹配代价分布、真实的匹配代价分布之间的相似性并作为网络监督...

【专利技术属性】
技术研发人员：百晓，张友敏，于洋，安冬，石翔，
申请(专利权)人：北京航空航天大学青岛研究院，上海歌尔泰克机器人有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人