【技术实现步骤摘要】
一种基于深度质量加权的RGB
‑
D显著性目标检测方法
:
[0001]本专利技术涉及计算机视觉和图像处理领域,尤其涉及一种基于深度质量加权的RGB
‑
D显著性目标检测方法。
技术介绍
:
[0002]在计算机视觉和图像处理领域,显著性目标检测(SOD)旨在通过模拟人类视觉注意机制,识别和分割给定数据(如RGB图片、RGB
‑
D图片、视频等)中最具吸引力的物体或区域,已广泛应用于各种计算机视觉任务中,如语义分割,图像压缩,目标跟踪等等。
[0003]由于单一的模态的RGB显著性目标检测算法在面临复杂背景和光照条件等挑战性因素,难以从杂乱的背景中定位显著目标。克服这些挑战的一种方法是使用深度图来弥补RGB图像中缺失的空间信息。RGB图像包含细节信息(如丰富的纹理、颜色和外观线索),而深度图提供空间信息,表达几何结构和距离信息。因此,将RGB图像与深度图相结合用于SOD任务(称为RGB
‑
D SOD)是一种合理的选择,它可以处理更复杂的场景,满足高级检测的需求。
[0004]尽管现有的RGB
‑
D SOD方法已经取得了显著的进展,但大多数都忽略了低质量的深度图会对RGB
‑
D SOD任务产生不利影响的问题。高质量的深度图具有清晰的边界和准确的目标定位,有助于SOD。然而,低质量的深度图不仅边缘模糊,而且目标定位不准确,这可能在跨模态特征融合引入一定的噪声,从而降低SOD的性能。因此,在RGB
‑< ...
【技术保护点】
【技术特征摘要】
1.一种基于深度质量加权的RGB
‑
D显著性目标检测方法,其特征在于,该方法包括以下步骤:1)获取训练和测试该任务的RGB
‑
D数据集,并定义本发明的算法目标,并确定用于训练和测试算法的训练集和测试集;2)构建用于提取RGB图像特征RGB编码器和深度(Depth)图像特征Depth编码器;3)建立跨模态特点融合网络,通过加权式引导的深度质量评估机制指导RGB图像特征和Depth图像特征进行交叉加权融合;4)基于上述的跨模态特点融合成的多模态特征,构建双向尺度相关卷积融合机制,以增强多模态特征的高级语义信息;5)建立解码器,并通过激活函数得到最终的预测到的显著图;6)预测出来的显著图P
est
与人工标注的显著目标分割图P
GT
进行损失函数的计算,并通过Adam和反向传播算法逐步更新本发明提出的模型的参数权重,最终确定RGB
‑
D显著性检测算法的结构和参数权重。7)在步骤6确定模型的结构和参数权重的基础上,对测试集上的RGB
‑
D图像对进行测试,生成显著图P
test
,并使用评价指标进行性能评估。2.根据权利要求1所述的一种基于深度质量加权的RGB
‑
D显著性目标检测方法,其特征在于:所述步骤1)具体方法是:将NJUD数据集、NLPR数据集和DUT
‑
RGBD数据集作为训练集,将剩余部分的NJUD数据集、剩余的NLPR数据集、SIP数据集、LFSD数据集和RGBD135数据集作为测试集。3.根据权利要求1所述的一种基于深度质量加权的RGB
‑
D显著性目标检测方法,其特征在于:所述步骤2)具体方法是:3.1)利用VGG16作为本发明的模型的主干网络,用于提取RGB图像特征和对应的Depth图像特征,分别为和其中i表示层数,对应于VGG16的每层输出。3.2)采用在ImageNet数据集预训练的VGG16参数权重初始化本发明的用于构建主干网络的VGG...
【专利技术属性】
技术研发人员:夏晨星,杨凤,梁兴柱,崔建华,王列伟,段松松,
申请(专利权)人:安徽理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。