【技术实现步骤摘要】
一种基于RGB
‑
D图像的视觉显著性目标检测方法
[0001]本专利技术属于计算机视觉和图像处理领域,具体为一种基于
RGB
‑
D
图像的视觉显著性目标检测
(Salient Object Detection
,
SOD)
算法
。
技术介绍
[0002]人类的视觉系统可以通过独特的感知单元和神经结构从复杂的场景中快速关注到感兴趣的目标或区域,这被称之为视觉注意力机制
。
一般来说,人类的视觉注意力包含了自底向上和自顶向下两条通路:自底向上的注意力机制是由数据驱动的
,
是人脑对外界事物的非自主性感知;而自顶向下的注意力机制是由意识驱动的,是人脑主动下发指令去捕获感兴趣目标的过程
。
受此启发,人们希望计算机也具有这种能力,于是显著性目标检测
(Salient Object Detection
,
SOD)
任务应运而生,旨在让计算机自动从给定场景中检测出最吸引人注意的区域或目标,已经被广泛应用在了包括图像分割
、
视频压缩
、
目标检测在内的大量计算机视觉任务中
。
经过十余年的发展,显著性目标检测任务已经衍生出了包括面向
RGB
图像的显著性目标检测
、
面向高分辨率
RGB
图像的显著性目标检测
、
面向
RGB
‑
【技术保护点】
【技术特征摘要】
1.
一种基于
RGB
‑
D
图像的视觉显著性目标检测方法,其特征在于,包括如下步骤:
S1、
收集整理现有的可用于显著性目标检测的
RGB
‑
D
图像数据集;
S2、
分析现有的基于
RGB
‑
D
图像的显著性目标检测算法的优点与仍存在的问题,搭建显著性目标检测网络与各个模块;
S3、
进行多次实验,对不同的模块
、
网络结构和参数进行调优,并记录每次的实验结果;
S4、
通过计算平均绝对误差来完成量化指标的评估,评估所构建的网络是否有效,并验证所提出的各个模块是否有效;所述
S2
中采用双分支编码器来分别提取
RGB
图像的表征信息和深度信息,通过全局平均池化对多尺度信息完成聚合,采用注意力特征融合模块来对
S3
中所提取到的多层级多尺度特征进行融合,并通过注意力感知对噪声信息进行过滤,并在提取到有效特征之后,使用上下文语义对齐采样来捕获通道间的相互依赖信息
。2.
根据权利要求1所述的一种基于
RGB
‑
D
图像的视觉显著性目标检测方法,其特征在于,所述
S1
中可用于
RGB
‑
D
的显著性目标检测共计5个数据集,分别为
STERE
数据集
、NJU2K
数据集
、DES
数据集
、NL PR
数据集和
SIP
数据集
。3.
根据权利要求2所述的一种基于
RGB
‑
D
图像的视觉显著性目标检测方法,其特征在于,所述
S2
中显著性目标检测网络以
RGB
图像
、
深度图及
RGB
图像
、
深度图的超像素映射作为输入源实现对
RGB
图像与深度图图像多模态信息的整合利用
。4.
根据权利要求3所述的一种基于
RGB
‑
D
图像的视觉显著性目标检测方法,其特征在于,所述
S2
中设计的网络为基于双分支编码器与特征金字塔的多层级神经网络,在特征金字塔网络中嵌入有通道信息提取策略,来保证模型对于相关特征的感知能力,在设计网络过程中的特征提取阶段对显著目标的边界建模,完成边缘信息的特征提取,以显著目标与背景边界的精准划分
。5.
根据权利要求4所述的一种基于
RGB
‑
D
图像的视觉显著性目标检测方法,其特征在于,还包括原型采样网络模块和依赖选择模块,将特征金字塔的输出和
SLIC
算法生成的
RGB
图像与深度图像的超像素映射作为原型生成模块...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。