基于注意力感知与缩放因子剪枝的声呐目标检测方法技术

技术编号:33736312 阅读:57 留言:0更新日期:2022-06-08 21:33
本发明专利技术公开了基于注意力感知与缩放因子剪枝的声呐目标检测方法。该检测方法的过程为:步骤1、搭建注意力感知目标检测网络,注意力感知目标检测网络包括注意力感知网络、路径聚合增强网络和多尺度联合预测网络。步骤2、使用声呐数据集对步骤1所得的注意力感知网络进行训练。步骤3、使用缩放因子衡量通道的重要性并进行模型剪枝。步骤4、使用步骤3得到的剪枝模型对声呐目标进行回归与定位。本发明专利技术中针对深度学习目标检测算法应用于声呐图像目标检测时,对细长、细小目标的定位回归精度不佳及算法自身参数量大、运算复杂的问题进行改进。通过注意力感知模块获得目标的短距离形变感知与长距离依赖感知,并通过缩放因子对模型进行轻量化处理。行轻量化处理。行轻量化处理。

【技术实现步骤摘要】
基于注意力感知与缩放因子剪枝的声呐目标检测方法


[0001]本专利技术属于人工智能与水声电子信息的
,具体涉及一种基于注意力感知与缩放因子剪枝结合的声呐目标轻量级检测方法。

技术介绍

[0002]声呐作为水下机器人、航行器等载具的辅助设备,为其执行海底目标探测识别、海床建模与绘图等任务提供有效的声学信息。声呐图像是声呐数据信息的一种直观表现形式。当前通过声呐图像实现海底探测的自动化、智能化已经成为一种主流的形式。
[0003]声呐图像目标检测技术是指在声呐图像的基础上,完成对感兴趣/可疑目标的检测,针对不同类的目标,给出不同类的预测结果,并提供相应的位置信息。传统的目标检测方法通常需要两步完成,首先需要进行目标与背景的前景背景分割,再通过对提取到的前景目标进行特征匹配,实现目标类别的判别回归。这种过程一般依赖于大量专业人员的先验目标工程知识,对目标特征进行手工设计,当目标出现刚性形变、遮挡等类内变化时,需要为其重新设计手工特征,而且可移植性差,特征匹配速度慢。
[0004]近年来,基于卷积神经网络的目标检测算法发展迅速,逐渐形成以R

CNN为代表的基于兴趣区域的两阶段目标检测器和YOLO为代表的一阶段回归定位目标检测器。在自然语言处理任务上表现优异的Transformers,由于其可插入性强、任务关联性紧密的特点,当前也在逐步引入到计算机视觉任务,并且表现出强大的性能。
[0005]然而深度学习是依赖于数据驱动的算法,水下声呐图像需要通过大量湖试、海试获取,获取成本高,且由于水下环境多变、目标回声复杂导致水下数据可用数据少,可用信息有限。因此对深度学习目标检测算法在复杂小样本条件下的特征提取能力的要求进一步提高。此外不断加宽加深的深度学习网络结构在训练、测试过程中大量的矩阵运算、批处理操作、函数响应激活等,对数据存储内存大小及图形处理器显存大小要求较高。学术界在追求检测精度和检测速度的同时往往忽略了算法对资源的要求。在如今深度学习网络层次架构越来越多且复杂的情况下,提出一个检测精度高、检测速度快、方便移植的轻量级目标检测模型,将其落实到工程实践中,是一个势在必行的问题。

技术实现思路

[0006]本专利技术针对当前深度学习目标检测模型应用于声呐图像目标检测的不足,提出一种基于注意力感知与缩放因子剪枝结合的声呐目标轻量级检测方法。
[0007]本专利技术的具体步骤如下:
[0008]1.基于注意力感知与剪枝压缩的声呐目标轻量级检测方法,其特征在于:包括以下步骤:
[0009]步骤1、搭建注意力感知目标检测网络,注意力感知目标检测网络包括注意力感知网络、路径聚合增强网络和多尺度联合预测网络。
[0010]1‑
1.搭建注意力感知网络;注意力感知网络包括依次相连的五个跨阶段模块;其
中,第三个跨阶段模块为可变形跨阶段模块;第五个跨阶段模块为多头自注意力跨阶段模块;将第三、四、五个跨阶段模块输出的特征图分别称为特征图P3、P4、P5,用以向后输出。
[0011]1‑
2.搭建路径聚合增强网络;路径聚合增强网络对注意力感知网络中输出的三层特征图自下而上不断进行上采样、拼接操作融合低分辨率特征图的语义信息,自上而下进行下采样、拼接操作融合高分辨率特征图的结构信息,对特征的反复提取复用,输出三个尺度特征图。
[0012]1‑
3:搭建多尺度联合预测网络;多尺度联合预测网络对路径聚合增强网络输出的三个尺度特征图进行全卷积,得到检测结果;检测结果包含三层特征分类,每层均包含对声呐目标种类预测结果及预测回归框的中心点横坐标、纵坐标,长、宽、置信度的预测。
[0013]步骤2、使用声呐数据集对步骤1所得的注意力感知网络进行训练。
[0014]步骤3、使用缩放因子衡量通道的重要性并进行模型剪枝。
[0015]根据损失函数L,通过梯度下降策略对各层参数进行更新,对于在卷积层后跟有BN层的卷积核,获取其各个通道当前二维特征的缩放因子矩阵gamma和偏置beta,该缩放因子矩阵gamma表示卷积核各通道的缩放因子γ;根据预设的剪枝稀疏率确定缩放因子γ的阈值,设置掩膜矩阵,将缩放因子小于该阈值的通道的掩膜置为零,将缩放因子大于或等于该阈值的通道的掩膜置为1,得到剪枝模型。
[0016]步骤4、使用步骤3得到的剪枝模型对声呐目标进行回归与定位。
[0017]作为优选,在注意力感知网络中,第一个跨阶段模块的输入端设置有用于对输入数据进行升维操作的CBM模块。
[0018]作为优选,第三个跨阶段模块中增加通道数为2N的旁路卷积,保持卷积前后特征图尺寸不发生变化,计算卷积核沿x方向和y方向的偏移量;N为像素个数。
[0019]作为优选,第五个跨阶段模块中,对输入的特征进行步长为1的1
×
1卷积,以获得q向量、k向量、v向量;再对q、k、v向量沿着通道进行伸展,根据通道量进行划分实现多头机制;之后采用缩放点积的方式来计算注意力;将二维相对位置编码的方式表示的像素位置表达为r向量;对q向量进行缩放后分别与k向量的转置及r向量的转置进行点积操作,对所得两个向量相加后对进行softmax计算,将多头之间的相似度进行归一化处理,得到概率;然后用概率与v向量相乘得到注意力信息。
[0020]作为优选,注意力感知网络中,特征图P3和P4直接输出至路径聚合增强网络;特征图P5经过卷积后进入空间金字塔池化,池化后得到的特征进行拼接和卷积后,输出至路径聚合增强网络。
[0021]作为优选,路径聚合增强网络生成三个尺度特征图的过程为:特征图P5在经过卷积与最邻近插值上采样后与经过卷积后的特征图P4进行特征拼接,拼接后的特征经过1x1、3x3、1x1、3x3、1x1五次卷积后形成特征图Out4;特征图Out4上采样后,与特征图P3重复上述特征拼接和卷积操作生成特征图Out3;特征图Out3一方面作为第一尺度特征图,另一方面通过下采样再次与特征图Out4进行拼接卷积,得到第二尺度特征图;第二尺度特征图上采样后,与特征图P5重复上述特征拼接和卷积操作,得到第三尺度特征图。
[0022]作为优选,步骤2的执行过程具体如下:
[0023]2‑
1.对声呐图像目标训练数据集使用K

means算法聚类获取预定义锚框。
[0024]2‑
2.使用Mosaic增强算法对训练数据集进行增强。
[0025]2‑
3.对注意力感知目标检测网络实施Ranger梯度优化策略,以最小的计算开销实现任务收敛。
[0026]作为优选,步骤3中,稀疏正则化后的损失函数L的表达式如下:
[0027][0028]其中,(x,y)表示训练的输入和输出,W表示训练权重,为正常网络损失,g(
·
)表示缩放因子的正则化,γ为缩放因子,λ
s
为惩罚系数。
[0029]正常网络损失函数L
CIoU<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于注意力感知与剪枝压缩的声呐目标轻量级检测方法,其特征在于:包括以下步骤:步骤1、搭建注意力感知目标检测网络,注意力感知目标检测网络包括注意力感知网络、路径聚合增强网络和多尺度联合预测网络;1

1.搭建注意力感知网络;注意力感知网络包括依次相连的五个跨阶段模块;其中,第三个跨阶段模块为可变形跨阶段模块;第五个跨阶段模块为多头自注意力跨阶段模块;将第三、四、五个跨阶段模块输出的特征图分别称为特征图P3、P4、P5,用以向后输出;1

2.搭建路径聚合增强网络;路径聚合增强网络对注意力感知网络中输出的三层特征图自下而上不断进行上采样、拼接操作融合低分辨率特征图的语义信息,自上而下进行下采样、拼接操作融合高分辨率特征图的结构信息,对特征的反复提取复用,输出三个尺度特征图;1

3:搭建多尺度联合预测网络;多尺度联合预测网络对路径聚合增强网络输出的三个尺度特征图进行全卷积,得到检测结果;检测结果包含三层特征分类,每层均包含对声呐目标种类预测结果及预测回归框的中心点横坐标、纵坐标,长、宽、置信度的预测;步骤2、使用声呐数据集对步骤1所得的注意力感知网络进行训练;步骤3、使用缩放因子衡量通道的重要性并进行模型剪枝;根据损失函数L,通过梯度下降策略对各层参数进行更新,对于在卷积层后跟有BN层的卷积核,获取其各个通道当前二维特征的缩放因子矩阵gamma和偏置beta,该缩放因子矩阵gamma表示卷积核各通道的缩放因子γ;根据预设的剪枝稀疏率确定缩放因子γ的阈值,设置掩膜矩阵,将缩放因子小于该阈值的通道的掩膜置为零,将缩放因子大于或等于该阈值的通道的掩膜置为1,得到剪枝模型;步骤4、使用步骤3得到的剪枝模型对声呐目标进行回归与定位。2.根据权利要求1所述的基于注意力感知与剪枝压缩的声呐目标轻量级检测方法,其特征在于:在注意力感知网络中,第一个跨阶段模块的输入端设置有用于对输入数据进行升维操作的CBM模块。3.根据权利要求1所述的基于注意力感知与剪枝压缩的声呐目标轻量级检测方法,其特征在于:第三个跨阶段模块中增加通道数为2N的旁路卷积,保持卷积前后特征图尺寸不发生变化,计算卷积核沿x方向和y方向的偏移量;N为像素个数。4.根据权利要求1所述的基于注意力感知与剪枝压缩的声呐目标轻量级检测方法,其特征在于:第五个跨阶段模块中,对输入的特征进行步长为1的1
×
1卷积,以获得q向量、k向量、v向量;再对q、k、v向量沿着通道进行伸展,根据通道量进行划分实现多头机制;之后采用缩放点积的方式来计算注意力;将二维相对位置编码的方式表示的像素位置表达为r向量;对q向量进行缩放后分别与k向量的转置及r向量的转置进行点积操作,对所得两个向量相加后对进行softmax计算,将多头之间的相似度进行归一化处理,得到概率;然后用概率与v向量相乘得到注意力信息。5.根据权利要求1所述的基于注意力感知与剪枝压缩的声呐目标轻量级检测方法,其特征在于:注意力感知网络中,特征图P3和P4直接输出至路径聚合增强网络;特征图P5经过卷积后进入空间金字塔池化,池化后得到的特征进...

【专利技术属性】
技术研发人员:孔万增胡宏洋
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1