一种基于两级优化网络的伪装物体检测方法技术

技术编号:32655667 阅读:21 留言:0更新日期:2022-03-17 11:03
本发明专利技术涉及伪装物体检测的技术领域,特别是涉及一种基于两级优化网络的伪装物体检测方法,目的是解决现有伪装物体检测技术中存在的检测精度不足的问题,提出了一种基于多任务学习的检测方法,以物体边界信息作为辅助,用来引导网络更好地学习边界处伪装物体纹理与背景纹理之间的差异,从而使得网络能够更好地对伪装物体进行定位并分割;两级优化网络共分为两个阶段,第一阶段遵循编码器

【技术实现步骤摘要】
一种基于两级优化网络的伪装物体检测方法


[0001]本专利技术涉及伪装物体检测的
,特别是涉及一种基于两级优化网络的伪装物体检测方法。

技术介绍

[0002]随着人们对智能生活的需求趋于多样性,目标检测的应用范围也变得愈加广泛,伪装物体检测即是其重要分支之一。其关注的是物体与周围的关系,旨在将“融入”周围环境的伪装物体检测并分割出来。伪装现象在人类生活和自然界中无处不在,尤其常见于动物。在动物捕猎或躲避天敌的过程中,许多动物都会通过改变自身的体色、形态、动作等方式,降低自身与周围环境的差异与对比度,以提升自身生存能力。这些伪装策略通常都是基于模糊观察者的判定能力实现的。
[0003]生物学研究表明,人类视觉系统(HVS)对大块区域和颜色特征最为敏感,其主要通过观察物体与其背景之间的对比度来感知目标。因此,HVS可能由于伪装物体与环境的低对比度而难以对其进行识别。
[0004]然而在某些情况下,伪装物体识别是非常必要的。除了该任务本身对于动物伪装现象的检测可以为动物保护提供技术支持之外,生活中仍存在许多物体和背景高度相似的被动伪装现象:在医学领域中,相似度极高的背景组织中的细微变化即有可能代表着某种病变;而在军事领域中,战场上对于迷彩伪装的检测也可能扭转局势。因此该任务的发展具有重要意义。
[0005]近年来,深度卷积网络以其强大的特征表示能力在各种计算机视觉任务中逐渐兴起,一些现有的伪装物体检测方法也基于此实现:Fan等人提出SINet对提取的特征进行分层。然后将这些不同层的特征进行融合、增强,以帮助获取定位和边缘信息,从而实现对伪装目标的准确检测。Yan等人将MirrorNet分为原始图像分割流和镜像分割流以寻找原始图像和翻转图像之间的视觉差异,从而更好地定位伪装物体。
[0006]尽管这些方法是根据伪装对象的属性提出的,但在边缘处理方面仍有改进的空间。因此,在本专利技术中,我们进一步考虑了伪装物体的边界信息,从而让模型更好地学习伪装物体和环境在边界处的差异,由此更加准确地定位并分割伪装物体。

技术实现思路

[0007]本专利技术的目的是解决现有伪装物体检测技术中存在的检测精度不足的问题,提出了一种基于多任务学习的检测方法,以物体边界信息作为辅助,用来引导网络更好地学习边界处伪装物体纹理与背景纹理之间的差异,从而使得网络能够更好地对伪装物体进行定位并分割。
[0008]本专利技术的一种基于两级优化网络的伪装物体检测方法,两级优化网络共分为两个阶段,第一阶段遵循编码器

解码器结构,以ResNet50作为特征提取的主干,用于对伪装物体进行定位、识别,形成粗糙映射。第二阶段使用并行的解码器结构,以物体边缘作为边界
信息,促进网络关注物体边缘,对第一阶段生成的映射进行优化。
[0009]进一步地,第一阶段为前特征融合阶段,选用ResNet50作为骨干网络,以保证能够有效提取到深层特征;
[0010]该阶段目的是获得一个粗略的伪装物体映射图,基于对计算效率和检测精度的考量,提出以下两个模块:
[0011](1)通道注意力模块:
[0012]在编码器每一层的输出上都应用一个通道注意力机制,以保留浅层特征中的有用信息,减少冗余信息;
[0013]其旨在提取有效信息,可以表示为:
[0014][0015]其中,Attention表示该通道注意力模块,则为自底向上第i个通道注意力模块的输出,为编码阶段中的中第i个编码块。
[0016]该通道注意力模块共有4层:第一个卷积层的尺寸为1
×
1,用以将通道数降为32层;其后为两个3
×
3的卷积层,每个卷积层后都使用了归一化,经过这两层后图像通道仍保持为32层,且尺寸不变;最后经过一层Relu函数,获得最终的特征;
[0017](2)全局特征和局部特征融合模块:
[0018]该模块在解码器阶段实现,其结构几乎与编码器对称,解码器每层都包括两个3
×
3卷积层并随后使用了归一化和ReLu函数,该模块还引入了cSE模块和sSE模块以获取更精确的检测结果,这些模块可以更好地建立不同通道之间的依赖关系并引导网络关注和伪装物体有关的特征,此外对编码器最后一层的输出结果使用了金字塔池化模块以获得全局特征,解码器每层输入都为对应通道注意力模块输出结果和经过上采样的上一层输出结果的组合:
[0019][0020][0021]其中GLFA表示全局特征和局部特征融合模块中的解码器模块,PPM表示引入的金字塔池化模型,Cat表示特征图的连接,Upsample表示上采样过程,为自底向上第i个通道注意力模块的输出,为全局特征和局部特征融合模块中第i层输出。
[0022]由此,解码器可以学习到更全面的语义信息,并构建一个预测模块以获得最终结果,其包含一个3
×
3的卷积层,ELU激活函数,以及一个1
×
1卷积层,其可表示为:
[0023][0024]其中ELU表示ELU激活函数,Conv表示应用在此处的两个卷积层,Upsample表示上采样,表示该模块自底向上第4层的输出结果,以使得预测图和最终的真值图具有同样的大小。
[0025]进一步地,第二阶段为优化阶段,优化阶段旨在利用物体边缘信息进一步将伪装物体从背景中区分出来;在该阶段引入边缘真值图作为监督信息,以使模型更加关注于物体在边缘处的区别;其具体为:
[0026]优化模块使用和全局特征和局部特征融合模块相同的解码器结构,并与其形成并行对应关系,该模块中每层的输入也为对应通道注意力模块输出结果和经过上采样的上一层输出结果的组合,因此,优化模块可以进一步利用前特征融合阶段中的特征,对其提取过程起到约束作用,同时使特征重构过程更加全面,由此精化最终的预测图;
[0027]该阶段最终的预测结果可表示为:
[0028][0029]其中ELU表示ELU激活函数,Conv表示应用在此处的两个卷积层,Upsample表示上采样,表示该阶段编码器自底向上第4层的输出结果,以使得预测图和最终的边缘真值图具有同样的大小。
[0030]两级优化网络的损失由两个解码器的预测损失加和得到,选择二值交叉熵损失作为损失函数,整体的损失函数为:
[0031][0032]其中L
total
表示整体损失,表示前融合阶段的损失,即pred_c为前特征融合模块的预测结果和GT为真值图;表示优化模块的损失,pred_e为边缘优化模块预测结果,GT_edge为通过真值图计算得到的边缘真值图。
[0033]与现有技术相比本专利技术的有益效果为:
[0034](1)性能好,在公开的伪装物体检测数据集上与的结果显示,本专利技术在四种不同的评价指标中都能达到最好的效果;
[0035](2)效率高,在本方法所采用的架构中仅有提取到的有用特征被输入到解码过程中,从而大量地减少了卷积运算的次数,使得本方法更加具有实际应用意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于两级优化网络的伪装物体检测方法,其特征在于,两级优化网络共分为两个阶段,第一阶段遵循编码器解码器结构,以ResNet50作为特征提取的主干,用于对伪装物体进行定位、识别,形成粗糙映射;第二阶段使用并行的解码器结构,以物体边缘作为边界信息,促进网络关注物体边缘,对第一阶段生成的映射进行优化。2.如权利要求1所述的一种基于两级优化网络的伪装物体检测方法,其特征在于,第一阶段为前特征融合阶段,选用ResNet50作为骨干网络,以保证能够有效提取到深层特征;该阶段目的是获得一个粗略的伪装物体映射图,基于对计算效率和检测精度的考量,提出以下两个模块:(1)通道注意力模块:在编码器每一层的输出上都应用一个通道注意力机制,以保留浅层特征中的有用信息,减少冗余信息;其旨在提取有效信息,可以表示为:其中,Attention表示该通道注意力模块,则为自底向上第i个通道注意力模块的输出,为编码阶段中的中第i个编码块;该通道注意力模块共有4层:第一个卷积层的尺寸为1
×
1,用以将通道数降为32层;其后为两个3
×
3的卷积层,每个卷积层后都使用了归一化,经过这两层后图像通道仍保持为32层,且尺寸不变;最后经过一层Relu函数,获得最终的特征;(2)全局特征和局部特征融合模块:该模块在解码器阶段实现,其结构几乎与编码器对称,解码器每层都包括两个3
×
3卷积层并随后使用了归一化和ReLu函数,该模块还引入了cSE模块和sSE模块以获取更精确的检测结果,这些模块可以更好地建立不同通道之间的依赖关系并引导网络关注和伪装物体有关的特征,此外对编码器最后一层的输出结果使用了金字塔池化模块以获得全局特征,解码器每层输入都为对应通道注意力模块输出结果和经过上采样的上一层输出结果的组合:合:其中GLFA表示全局特征和局部特征融合模块中的解码器模块,PPM表示引入的金字...

【专利技术属性】
技术研发人员:姜璇张亚杰苏荔李国荣黄庆明
申请(专利权)人:中国科学院大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1