【技术实现步骤摘要】
一种跨维度交互式显著检测模型及其检测方法
[0001]本专利技术属于显著性检测
,涉及一种跨维度交互式显著检测模型及其检测方法。
技术介绍
[0002]显著的目标检测和固定的眼睛视觉检测是计算机视觉研究涉及的两个方面。显著目标检测目的是对图像的弱像素和突出像素之间进行有效、准确的分割,它在图像分割、桥梁裂缝检测、图像检索、车辆检测等领域应用比较广泛。
[0003]近年来,随着深度学习的快速发展,许多学者通过CNN对显著目标进行学习、研究。例如PiCANet利用对全局上下信息和局部上下文信息的整合实现对显著区域进行识别提取,该网络无法适应复杂背景对显著目标进行有效提取,详见“Liu N,Han J,and Yang M H,et al.PiCANet:Learning pixel
‑
wise contextual attention for saliency detection.IEEE/CVF Conference on Computer Vision and Pattern Recognition,2018,3089
–
3098.”。GCPANet增强了顶层特征、减少了信息冗余,但该网络在对显著物体边缘细节处理上,存在模糊和丢失现象,详见“Chen Z,Xu Q,Cong R,et al.Global Context
‑
Aware Progressive Aggregation Network for Salient Object Detectio ...
【技术保护点】
【技术特征摘要】
1.一种跨维度交互式显著检测模型,其特征在于,包括依次连接的基础特征提取模块、有效特征提取模块和聚合模块;所述基础特征提取模块,用于对原始图像的纹理、空间、颜色等特征信息进行提取;所述有效特征提取模块,用于对基础特征关注更多有效区域的特征,同时抑制背景噪声的干扰;所述聚合模块,用于对基础特征、高级特征和全局上下文特征进行融合,生成显著预测图。2.根据权利要求1所述的一种跨维度交互式显著检测模型,其特征在于,所述基础特征提取模块由多个多尺度特征提取单元组成,所述多尺度特征提取单元包含3到5个结构相同的Bottleneck,每个Bottleneck均采用1
×
1、3
×
3、1
×
1的卷积核组成;输入的特征通过多尺度特征提取单元的第一个Bottleneck结构,通过1
×
1的卷积对输入的特征进行降维,做一次3
×
3卷积操作,最后通过1
×
1卷积恢复维度,在卷积处理完后需要进行归一化和激活操作;后面的Bottleneck与第一个Bottleneck操作相似,第一个Bottleneck进一步下采样操作;最后输出的特征图作为下一个多尺度特征提取单元的输入。3.根据权利1所述的一种跨维度交互式显著检测模型,其特征在于,所述有效特征提取模块包括CL模块、SR模块和CF模块;所述CL模块,用于对基础特征进行空间和通道之间跨维度交互,生成权重反作用基础特征,对基础特征背景噪声进行抑制,关注、保留更多有效区域信息,作为SR模块的输入;所述SR模块,用于对CL模块处理后的特征进行增强、细化处理;所述CF模块,用于对基础特征的显著区域进行增强响应,作用于网络的全局上下文信息。4.根据权力3所述的一种跨维度交互式显著检测模型,其特征在于,所述CL模块由三个分支平行连接,最终通过平均运算对三个分支特征进行融合;其中,第一分支以空间H为轴,进行空间W和通道C维度交换:输入特征以空间H为轴,逆时针旋转90
°
,接着由Z
‑
Pool里的平均聚合和最大聚合算法进行处理,生成的特征图进行拼接,然后通过Sigmoid函数激活,生成反码和偏置,通过加法和乘法用于旋转特征,最后再以空间H为轴,顺时针旋转90
°
,输出第一分支特征图;第二、第三分支操作与第一分支区别在于:第二之分支以空间W为轴旋转,第三分支不需要旋转,其他操作过程都和第一分支相同;得到的三个分支特征通过平均算法进行融合;所述SR模块,用于对CL模块的输出进行增强、细化操作;再通过卷积核为3
×
3的卷积,上采样操作后,作为聚合模块的输入;所述CF模块,主要有两个平行分支构建,其中第一分支通过卷积核为3
×
3,通道为256的卷积对基础特征进行处理;第二分支通过卷积核为3
×
3,通道为512的卷积对基础特征进行处理,然后生成偏置和掩码,通过乘法和加法操作与第一分支特征进行融合,作为聚合模块的输入,为整个网络提供用于获取全局上下文信息。5.根据权利1所述的一种跨维度交互式显著检测模型,其特征在于,所述聚合模块将基础特征Out
t
(t=2,3,4)、高级特征和全局上下纹特征F2进行三分支处理,然后将
处理后的特征通过拼接融合;所述拼接融合过程为:将Out
t
、F2通过卷积核为3
×
3,通道为256,步长为1的操作进行压缩处理后,将所有特征通道统一为256,卷积后经过归一化和激活处理得到特征通道统一为256,卷积后经过归一化和激活处理得到对于第一分支,首先通过卷积核为3
×
3,通道为256,步长为1进行处理,然后与进行乘积得到对于第二分支,首先通过卷积核为3
×
3,通道为256,步长为1进行处理,然后与上采样后的进行乘积得到对于第三分支,通过卷积核为3
×
3,通道为256,步长为1进行处理,然后与进行乘积得到最后通过Concat将进行拼接融合,通过卷积核为3
×
3的卷积层输出显著预测图。6.如权利要求1~5任一项所述的一种跨维度交互式显著检测模型的显著检测方法,其特征在于,按照以下步骤进行:步骤S1、将待检测的原始图像输入到基础特征提取模块中;步骤S2、基础特征提取模块对待检测的原始图像进行特征提取,得到待检测的原始图像不同尺度、不同空间的基础特征图Out
t
;步骤S3、将待检测的原始图像不同尺度的基础特征图Out
t
输入到有效特征提取模块中,经有效特征模块进行跨维度交互和全局上下文有效区域关注,得到低级特征和全局上下文特征F2;步骤S4、利用聚合模块将待检测的原始图像的低级特征Out
t
、高级特征和全局上下文特征F2进行融合,得到显著预测图。7.根据权力要求6所述的一种跨维度交互式显著检测模型的显著检测方法,其特征在于,所述步骤S2中基础特征提取模块中单个Bottleneck输出计算公式如下:f1=δ((T1×1(X))f2=δ(T3×3(f1))f3=δ(T1×1(f2))其中,X为当前Bottleneck提取层的输入;T表示Bottleneck提取层中的卷积操作,其下标表示卷积核的尺度;δ表示当前提取层的激活函数;f1表示当前Bottleneck卷积结构中1
×
1卷积处理、激活处理后的结果;f2表示当前Bottleneck卷积结构中3
×
3卷积处...
【专利技术属性】
技术研发人员:赵佰亭,张华,郭永存,贾晓芬,黄友锐,马天兵,
申请(专利权)人:安徽理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。