一种基于改进的Efficientdet的水面目标检测方法及其系统技术方案

技术编号：38005234 阅读：8 留言：0更新日期：2023-06-30 10:20

本发明专利技术公开了一种基于改进的Efficientdet的水面目标检测方法及其系统，包括：在主干特征提取网络Efficientnet的主要模块MBConv中引入注意力机制CA，将MBConv改进为CA

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进的Efficientdet的水面目标检测方法及其系统

[0001]本专利技术属于水面目标检测
，具体涉及一种基于改进的Efficientdet的水面目标检测方法及其系统。

技术介绍

[0002]在当前世界背景下，海洋安全是国家安全的重点方向，也是国防和民生安全的重中之重。检测海上目标图像重要信息，属于水面目标检测
水面目标检测技术的发展对于军用海湾、港口的管理和民用捕鱼船只的监管等都有着深远意义，是实现海洋安全的一种重要途径。水面目标检测系统可分为远距离系统和近距离系统，远距离系统主要是雷达、红外目标探测，近距离系统主要是视觉采集和探测。由于远距离系统作用距离较远，获取到的图像信息量少，已经不能满足国防安全的需要，因此近距离系统成为了目前水面目标检测技术的热门选择。
[0003]近年来，随着深度学习在人工智能背景下的迅速发展，将其应用到近距离系统中来提高水面目标检测精度的进程刻不容缓。海洋相比于陆地条件更加恶劣，存在水面折射、天气多变、设备不稳定等多种因素，因此，水面目标检测模型的信息处理能力和信息检测精度，决定了能否在复杂时变的水面环境中准确地检测到水面目标。
[0004]目前，深度学习目标检测模型层出不穷，其中单阶段检测模型中最经典的是YOLO系列，中国专利申请(CN109492561A)公开了一种基于改进YOLOV2模型的光学遥感图像舰船检测方法，通过修正损失函数来提高YOLOV2对舰船的检测能力。《2022 2nd International Conference o...

【技术保护点】

【技术特征摘要】
1.一种基于改进的Efficientdet的水面目标检测方法，其特征在于，包括以下步骤：步骤一、将挑战性水面数据集WSODD以VOC格式存储在算法目录下，并按照8：1：1的比例划分训练集、测试集、验证集，划分好的图片信息用.txt格式存放；步骤二、将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练，从中提取P3
‑
P5级特征；其中，在主干特征提取网络Efficientnet的2
‑
8层的每层MBConv中引入注意力机制CA，得到CA
‑
MBConv；步骤三、将主干特征提取网络输出的P3
‑
P5级特征经过1
×
1卷积生成P3_in到P5_in，再将P5_in经过两次下采样得到P6_in、P7_in；再将P3_in到P7_in输入到特征融合网络Cot
‑
BIFPN中，使特征经由三次自上而下和自下而上的特征融合；其中，在特征融合网络BIFPN的卷积操作Conv7_down到Conv4_down、Conv3_up到Conv6_up中引入Cot模块，得到Cot
‑
BIFPN；步骤四、将特征融合网络Cot
‑
BIFPN输出的五个有效特征层P3_out到P7_out传输到ClassNet+BoxNet中，获得最终检测结果；其中，将ClassNet、BoxNet中的激活函数替换为H
‑
Swish；步骤五、将改进后的Efficientdet模型用WSODD训练集进行训练，epoch参数从300
‑
650以50为间隔取值，每个训练结果的权值文件均以.pth格式存放，使用WSODD测试集对所有权值文件进行mAP计算；对比epoch取值与mAP的关系，得到最优epoch取值；其中，epoch＝500时mAP最高，可达48.00％，因此选取500为改进后模型epoch的取值；步骤六、从WSODD验证集中选取两张真实水面环境拍摄的图片，分别输入到原始Efficientdet和改进后的Efficientdet模型中进行检测，并对比检测结果。2.根据权利要求1所述的一种基于改进的Efficientdet的水面目标检测方法，其特征在于，所述步骤二中，将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练，从中提取P3
‑
P5级特征；在主干特征提取网络2
‑
8层的每层MBConv中引入注意力机制CA，得到CA
‑
MBConv，其实现步骤如下：S2.1将输入的特征图经过1
×
1卷积升维，增加输入的通道数；S2.2将经过升维的特征图输入到深度可分离卷积DepthwiseConv中；S2.2.1对特征图进行分组，每一组都进行3
×
3卷积操作，收集每个通道的空间特征；S2.2.2将经过卷积操作的各组特征图输入到1
×
1卷积中，构造各组3
×
3卷积的线性组合，收集每个点的特征；S2.3将经过深度可分离卷积后的特征图输入到CA模块中，获得通道之间的相关性信息和空间特征点的位置信息：S2.3.1首先对输入的特征图进行坐标信息编码Coordinate information embedding；S2.3.1.1输入经过深度可分离卷积后C
×
H
×
W的特征图x，其中C、H、W分别代表通道数、特征图高、特征图宽；S2.3.1.2将特征图x经过(H,1)或(1,W)尺寸的池化核，使每个通道的信息分别沿着水平和垂直方向进行编码，高度为h的第c个通道输出为：宽度为w的第c个通道输出为：
其中，x
c
表示第c个通道的特征映射；i,j表示循环变量；S2.3.1.3将经过编码的信息按照水平和垂直方向聚合特征，输出一对含有方向感知的特征图，获得全局感受野并将精确的位置信息编码，提高网络对感兴趣目标检测的精度；S2.3.2再将经过坐标信息编码的特征图输入到坐标注意力生成Coordinate attention generation中；S2.3.2.1将水平和垂直方向上输出的特征图y
h
和y
w
进行串联编码，使用1
×
1卷积进行操作，用F1表示，输出f表示在水平和垂直方向的中间特征...

【专利技术属性】
技术研发人员：马赛，解志斌，邵长斌，张金波，
申请(专利权)人：江苏科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人