一种基于深度质量加权的RGB-D显著性目标检测方法技术

技术编号：38046103 阅读：13 留言：0更新日期：2023-06-30 11:12

本发明专利技术属于计算机视觉领域，提供了一种基于深度质量加权的RGB

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度质量加权的RGB
‑
D显著性目标检测方法

：
[0001]本专利技术涉及计算机视觉和图像处理领域，尤其涉及一种基于深度质量加权的RGB
‑
D显著性目标检测方法。

技术介绍
：
[0002]在计算机视觉和图像处理领域，显著性目标检测(SOD)旨在通过模拟人类视觉注意机制，识别和分割给定数据(如RGB图片、RGB
‑
D图片、视频等)中最具吸引力的物体或区域，已广泛应用于各种计算机视觉任务中，如语义分割，图像压缩，目标跟踪等等。
[0003]由于单一的模态的RGB显著性目标检测算法在面临复杂背景和光照条件等挑战性因素，难以从杂乱的背景中定位显著目标。克服这些挑战的一种方法是使用深度图来弥补RGB图像中缺失的空间信息。RGB图像包含细节信息(如丰富的纹理、颜色和外观线索)，而深度图提供空间信息，表达几何结构和距离信息。因此，将RGB图像与深度图相结合用于SOD任务(称为RGB
‑
D SOD)是一种合理的选择，它可以处理更复杂的场景，满足高级检测的需求。
[0004]尽管现有的RGB
‑
D SOD方法已经取得了显著的进展，但大多数都忽略了低质量的深度图会对RGB
‑
D SOD任务产生不利影响的问题。高质量的深度图具有清晰的边界和准确的目标定位，有助于SOD。然而，低质量的深度图不仅边缘模糊，而且目标定位不准确，这可能在跨模态特征融合引入一定的噪声，从而降低SOD的性能。因此，在RGB
‑<...

【技术保护点】

【技术特征摘要】
1.一种基于深度质量加权的RGB
‑
D显著性目标检测方法，其特征在于，该方法包括以下步骤：1)获取训练和测试该任务的RGB
‑
D数据集，并定义本发明的算法目标，并确定用于训练和测试算法的训练集和测试集；2)构建用于提取RGB图像特征RGB编码器和深度(Depth)图像特征Depth编码器；3)建立跨模态特点融合网络，通过加权式引导的深度质量评估机制指导RGB图像特征和Depth图像特征进行交叉加权融合；4)基于上述的跨模态特点融合成的多模态特征，构建双向尺度相关卷积融合机制，以增强多模态特征的高级语义信息；5)建立解码器，并通过激活函数得到最终的预测到的显著图；6)预测出来的显著图P
est
与人工标注的显著目标分割图P
GT
进行损失函数的计算，并通过Adam和反向传播算法逐步更新本发明提出的模型的参数权重，最终确定RGB
‑
D显著性检测算法的结构和参数权重。7)在步骤6确定模型的结构和参数权重的基础上，对测试集上的RGB
‑
D图像对进行测试，生成显著图P
test
，并使用评价指标进行性能评估。2.根据权利要求1所述的一种基于深度质量加权的RGB
‑
D显著性目标检测方法，其特征在于：所述步骤1)具体方法是：将NJUD数据集、NLPR数据集和DUT
‑
RGBD数据集作为训练集，将剩余部分的NJUD数据集、剩余的NLPR数据集、SIP数据集、LFSD数据集和RGBD135数据集作为测试集。3.根据权利要求1所述的一种基于深度质量加权的RGB
‑
D显著性目标检测方法，其特征在于：所述步骤2)具体方法是：3.1)利用VGG16作为本发明的模型的主干网络，用于提取RGB图像特征和对应的Depth图像特征，分别为和其中i表示层数，对应于VGG16的每层输出。3.2)采用在ImageNet数据集预训练的VGG16参数权重初始化本发明的用于构建主干网络的VGG...

【专利技术属性】
技术研发人员：夏晨星，杨凤，梁兴柱，崔建华，王列伟，段松松，
申请(专利权)人：安徽理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人