基于多尺度特征交叉融合的水下目标检测方法技术

技术编号：43595513 阅读：11 留言：0更新日期：2024-12-11 14:45

本发明专利技术公开了一种基于多尺度特征交叉融合的水下目标检测方法，属于水下目标检测技术领域。本发明专利技术的水下目标检测网络采用串联的双编码器‑解码器结构，采用轻量化编码器结构进行多尺度特征提取，并通过MSFCA模块对小尺度特征图的增强处理，达到对水下目标图像中的目标特征的充分提取的目的；解码器负责将小尺度多通道的特征图逐步恢复和特征增强，其根据下采样操作所保留的特征图与解码过程中的对应层级的特征图进行拼接，以增强特征传播，补偿编码器阶段下采样过程产生的损失；最后再经过一次编码和解码的过程，并进行多层级特征拼接，将最后一次解码过程中获得的三个不同层级的特征送入对应的检测头结构并融合输出最终实现水下目标的精准检测。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及水下目标检测，尤其涉及一种基于多尺度特征交叉融合的水下目标检测方法。

技术介绍

1、近年来，我国面临着前所未有的海域安全、海洋资源开发和生态环境保护等挑战。在人工智能时代，急需大力发展面向复杂水下环境的智能安全算法。然而，由于水下环境的复杂性和有限的可见度，水中存在着聚集和堆积的微小目标，并受到光线吸收和散射的影响，从而容易导致模糊遮挡、色彩失真等问题。因此，如何通过网络模型和数据方面的研究，提高水下目标检测算法的准确性具有重要意义。

2、水下场景环境具备多样性，在不同水域/海域采集的图像具有不同的图像质量与目标种类。为了面对不同类型的探测需求，研究者们提出了多种水下目标检测方法。现有的水下目标检测方法分为三大类：两阶段检测方法、一阶段检测方法和基于transformer的检测方法。

3、两阶段检测方法主要是基于rcnn系列方法进行改进，使其更加适合水下目标检测任务。有学者改进了faster-rcnn的两阶段算法，用于检测海参、棘爪、扇贝、海星和水草。原有特征提取模块中的vgg16(visual geometry group network 16)被res2net101网络所取代，增强各网络层感受野的表达能力；其次，引入ohem(online hard example mining)算法，解决边界框正负样本不平衡问题；第三，利用giou(generalized intersection overunion)和soft-nms(soft non-maximum suppression)对边界框

4、一阶段检测方法主要基于yolo改进，相比于两阶段的算法需要先使用神经网络进行特征提取，然后再使用分类器对特征做分类的两步操作，yolo直接预测目标物体的类别和位置，大大地提升了检测的速度。针对yolov5s在检测水下目标时受水下环境噪声和目标尺度变化影响难以提取特征、小目标无法检测的问题，有学者构建一种基于yolov5s的新型水下目标检测器。它使用特征增强门控模块，选择性地抑制或增强多层次特征，降低水下复杂环境噪声对特征融合的干扰，利用相邻特征融合机制和动态融合模块，动态学习融合权值，逐步进行多层次特征融合。该方法相比于yolov5s在水下小目标检测任务上取得了不错的提升。cai提出一种基于弱监督学习框架的水下检测方法，同时训练两个yolov5深度学习检测器，并让它们基于在训练过程中看到的更干净的样本的选择来互相训练，实现了精度和速度之间的平衡。有学者将rt-detr中的解码器和辅助预测头集成到yolov8中，并应用了repulsion loss，为鱼类检测中普遍存在的遮挡和密集问题提供了解决方案。

5、基于transformer的目标检测模型依靠自注意力机制，为水下目标检测领域提供新的解决思路。detr是facebook团队提出的基于transformer的端到端目标检测，它将目标检测视为直接集合预测问题，舍弃了非极大值抑制nms后处理步骤以及anchor等先验知识和约束，基于集合的全局损失，通过二分匹配和transformer的编码器-解码器结构等手段，简化了目标检测的流程。rt-detr是基于detr改进的第一个实时端到端目标检测器。具体而言，rt-detr集成了一个高效的混合编码器，通过解耦尺度内交互和跨尺度融合来高效处理多尺度特征。同时作者提出了iou感知的查询选择机制，以优化解码器查询的初始化。此外，rt-detr支持通过使用不同的解码器层来灵活调整推理速度，而不需要重新训练，这有助于实时目标检测器的实际应用。rt-detr相比detr不管是实时性还是精确度都带来了巨大提升。针对水下图像严重退化无法快速准确地检测出目标的问题，htdet使用一种轻量级混合transformer网络提取全局上下文信息，然后采用细粒度特征金字塔网络克服微弱信号消失的问题并且在不引入额外参数的情况下，采用测试时间增强法进行推理。然而，基于transformer的目标检测方法往往会因为自注意力的计算产生大量的计算开销和冗余参数，难以实现轻量化部署。

6、本申请的专利技术人在实现本申请技术方案时发现：为了提高神经网络对水下目标检测的精确度，应该关注和优化以下两个方面：首先，在特征提取阶段，如何在下采样过程中充分提取水下模糊目标和小目标的特征，使网络对这些目标的感知能力提升进而实现水下目标精准检测；其次，在多层次特征融合阶段，如何充分利用多尺度特征，减少上采样和下采样过程中特征丢失的问题，使预测框更加精准。不管哪个方面，想要达到理想效果都是极大的挑战。

技术实现思路

1、本专利技术提出了一种基于多尺度特征交叉融合的水下目标检测方法，以实现水下目标的轻量级检测，以及提升水下目标检测的精确性。

2、本专利技术采用的技术方案为：

3、一种基于多尺度特征交叉融合的水下目标检测方法，该方法包括下列步骤：

4、步骤1，输入水下目标图像并对其进行预处理，得到训练数据集；

5、步骤2，搭建基于多尺度特征交叉融合的水下目标检测网络；

6、该水下目标检测网络采用串联的双编码器-解码器结构，对第一个编码器-解码器结构，采用轻量化编码器结构作为骨干网络对输入图像进行多尺度特征提取，编码器的末端连接一个多尺度交叉融合注意力mscfa模块，用于对小尺度特征图进行增强处理；解码器用于将小尺度多通道的特征图逐步恢复和特征增强，并且根据编码过程中下采样操作保留的特征图与解码过程中的对应层级的特征图进行拼接，以增强特征传播，补偿编码器阶段下采样过程产生的损失；

7、对第二个编码器-解码器结构，编码器和解码器之间连接一个mscfa模块，编码器用于对第一个编码器-解码器结构的输出特征图进行编码处理，解码器用于对mscfa模块的输出特图进行特征图逐步恢复和特征增强，并且第二个编码器-解码器结构的编码器根据上采样操作保留的特征图与第一个编码器-解码器结构的解码过程中的对应层级的特征图进行拼接；

8、将最后一次解码过程中获得的三个不同层级的特征图送入对应的检测头结构，融合三个检测头结构的输出得到水下目标的检测结果；

9、步骤3，基于训练数据集对搭建的基于多尺度特征交叉融合的水下目标检测网络进行训练，以优化网络参数，当满足预置的训练结束条件时，得到训练好的水下目标检测网络；

10、步骤4，将待检测的水下目标图像输入到训练好的水下目标检测网络中获取检测结果。

11、进一步的，第一个编码器-解码器结构中，编码器的每一编码层依次包括下采样卷积层和轻量级稠密瓶颈架构ldba模块；解码器的每一解码层依次包括上采样卷积层和快速特征增强ffe模块；

12、第二个编码本文档来自技高网...

【技术保护点】

1.基于多尺度特征交叉融合的水下目标检测方法，其特征在于，包括下列步骤：

2.如权利要求1所述的方法，其特征在于，第一个编码器-解码器结构中，编码器的每一编码层依次包括下采样卷积层和轻量级稠密瓶颈架构LDBA模块；解码器的每一解码层依次包括上采样卷积层和快速特征增强FFE模块；

3.如权利要求2所述的方法，其特征在于，第一编码器的编码层数量NE1设置为5。

4.如权利要求2所述的方法，其特征在于，MSCFA模块的结构设置为：

5.如权利要求2所述的方法，其特征在于，LDBA模块的结构设置为：

6.如权利要求2所述的方法，其特征在于，FFE模块依次包括：第一卷积层、切分层、部分卷积层、第二卷积层、批归一化层、拼接层、第三卷积层和第四卷积层；

7.如权利要求6所述的方法，其特征在于，部分卷积层处理的特征图为部分卷积层的输入特征图的1/2通道的连续部分。

8.如权利要求1至7任一项所述的方法，其特征在于，步骤3中，训练结束条件采用早停策略。

【技术特征摘要】

1.基于多尺度特征交叉融合的水下目标检测方法，其特征在于，包括下列步骤：

2.如权利要求1所述的方法，其特征在于，第一个编码器-解码器结构中，编码器的每一编码层依次包括下采样卷积层和轻量级稠密瓶颈架构ldba模块；解码器的每一解码层依次包括上采样卷积层和快速特征增强ffe模块；

3.如权利要求2所述的方法，其特征在于，第一编码器的编码层数量ne1设置为5。

4.如权利要求2所述的方法，其特征在于，mscfa模块的结构设置为：<...

【专利技术属性】
技术研发人员：饶云波，刘达浪，马岩锦，朱佳龙，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人