当前位置: 首页 > 专利查询>中国人民解放军军事科学院国防科技创新研究院专利>正文

一种自监督单目深度估计方法和装置制造方法及图纸

技术编号：32209972 阅读：25 留言：0更新日期：2022-02-09 17:15

本申请涉及深度估计技术领域，更为具体来说，本申请涉及一种自监督单目深度估计方法和装置。所述方法包括：获取视频数据；将所述视频数据输入训练好的教师模型，得到第一深度图；将所述视频数据输入训练好的学生模型，得到第二深度图和第一深度不确定性图；其中，所述教师模型的训练方式为自监督训练方式，所述学生模型的训练方式为有监督训练方式，且所述教师模型和所述学生模型采取联合训练。本申请可以有效地估计深度图，能感知并屏蔽深度估计结果中存在的噪声，使模型达到更好的估计精度，带来明显的性能提升。本申请以深度不确定性图的方式评价噪声的大小，提高了深度估计方法在真实环境中如无人驾驶等各种应用场景的可用性。实环境中如无人驾驶等各种应用场景的可用性。实环境中如无人驾驶等各种应用场景的可用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种自监督单目深度估计方法和装置

[0001]本申请涉及深度估计
，更为具体来说，本申请涉及一种自监督单目深度估计方法和装置。

技术介绍

[0002]深度估计是几乎所有移动机器人的高级应用，如自动驾驶等。虽然已有的传统方法通过双目相机、激光雷达、毫米波雷达等传感器或多或少地解决了这一问题，但是这些设备往往价格高昂且难以部署，因此人们逐渐对于使用成本低廉、部署简单、分辨率较高的单目摄像头实现深度估计产生了兴趣。
[0003]如今，基于深度学习的方法在许多图像处理任务中都显示出强大的性能。神经网络通过有监督的学习方法可以直接从单张图像中恢复出深度信息。但是这些方法需要大量带有精确标注的深度图作为标签，从而限制了自身的泛化能力。已有的工作在图像满足光度不变性的假设下，将深度估计任务与位姿估计任务结合起来，提出了一种新颖的自监督训练范式。这种自监督范式使用连续的图像数据作为输入，将目标帧与重建出的新图像之间的差异(即光度误差)作为监督信号，达到了与有监督方法相近的精度。
[0004]然而，深度学习固有的低可解释性问题仍然存在，阻碍了其在真实场景中的部署和应用，换言之，如何在单目自监督深度估计算法中应用不确定性仍然是一个有待解决的问题。

技术实现思路

[0005]基于上述技术问题，本专利技术旨在提供一种自训练机制和自提升机制的自监督单目深度估计方法与装置，教师模型采用自训练机制，学生模型采用自提升机制，教师模型和学生模型进行联合训练，训练好的教师模型能预测高精度的深度图，训练好的学生模型可...

【技术保护点】

【技术特征摘要】
1.一种自监督单目深度估计方法，其特征在于，包括：获取视频数据；将所述视频数据输入训练好的教师模型，得到第一深度图；将所述视频数据输入训练好的学生模型，得到第二深度图和第一深度不确定性图；其中，所述教师模型的训练方式为自监督训练方式，所述学生模型的训练方式为有监督训练方式，且所述教师模型和所述学生模型采取联合训练。2.根据权利要求1所述的自监督单目深度估计方法，其特征在于，所述教师模型和所述学生模型采取联合训练，包括：向教师模型载入无标注的视频数据；采取自监督训练方式进行训练教师模型，预测得到第三深度图；基于所述第三深度图创建带有伪标注的深度估计任务数据集；利用所述带有伪标注的深度估计任务数据集对学生模型采取有监督训练。3.根据权利要求2所述的自监督单目深度估计方法，其特征在于，所述利用所述带有伪标注的深度估计任务数据集对学生模型采取有监督训练之后，还包括：判断教师模型和学生模型是否收敛，若收敛则结束训练；若不收敛则预测得到第二深度不确定性图，并基于所述第二深度不确定性图计算深度不确定性遮罩；利用所述深度不确定性遮罩优化所述教师模型。4.根据权利要求3所述的自监督单目深度估计方法，其特征在于，所述向教师模型载入无标注的视频数据之后，还包括：判断教师模型是否存在深度不确定性遮罩，如果是，载入所述深度不确定性遮罩，如果否，载入空白遮罩。5.根据权利要求3所述的自监督单目深度估计方法，其特征在于，所述基于所述第二深度不确定性图计算深度不确定性遮罩的计算公式为：其中，∑
s
表示第二深度不确定性图，P
95％
表示深度不确定性图中第95个百分位数。6.根据权利要求1所述的自监督单目深度估计方法，其特征在于，所述方法还包括：基于教师模型的第一深度图约束学生模型的第二深度图和第一深度不...

【专利技术属性】
技术研发人员：史殿习，聂欣雨，陈旭灿，苏雅倩文，李睿豪，张拥军，
申请(专利权)人：中国人民解放军军事科学院国防科技创新研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人