一种基于改进的Efficientdet的水面目标检测方法及其系统技术方案

技术编号:38005234 阅读:8 留言:0更新日期:2023-06-30 10:20
本发明专利技术公开了一种基于改进的Efficientdet的水面目标检测方法及其系统,包括:在主干特征提取网络Efficientnet的主要模块MBConv中引入注意力机制CA,将MBConv改进为CA

【技术实现步骤摘要】
一种基于改进的Efficientdet的水面目标检测方法及其系统


[0001]本专利技术属于水面目标检测
,具体涉及一种基于改进的Efficientdet的水面目标检测方法及其系统。

技术介绍

[0002]在当前世界背景下,海洋安全是国家安全的重点方向,也是国防和民生安全的重中之重。检测海上目标图像重要信息,属于水面目标检测
水面目标检测技术的发展对于军用海湾、港口的管理和民用捕鱼船只的监管等都有着深远意义,是实现海洋安全的一种重要途径。水面目标检测系统可分为远距离系统和近距离系统,远距离系统主要是雷达、红外目标探测,近距离系统主要是视觉采集和探测。由于远距离系统作用距离较远,获取到的图像信息量少,已经不能满足国防安全的需要,因此近距离系统成为了目前水面目标检测技术的热门选择。
[0003]近年来,随着深度学习在人工智能背景下的迅速发展,将其应用到近距离系统中来提高水面目标检测精度的进程刻不容缓。海洋相比于陆地条件更加恶劣,存在水面折射、天气多变、设备不稳定等多种因素,因此,水面目标检测模型的信息处理能力和信息检测精度,决定了能否在复杂时变的水面环境中准确地检测到水面目标。
[0004]目前,深度学习目标检测模型层出不穷,其中单阶段检测模型中最经典的是YOLO系列,中国专利申请(CN109492561A)公开了一种基于改进YOLOV2模型的光学遥感图像舰船检测方法,通过修正损失函数来提高YOLOV2对舰船的检测能力。《2022 2nd International Conference on Consumer Electronics and Computer Engineering(ICCECE)》公开发表的《Residual YOLOX

based Ship Object Detection Method》Liu等通过引入残差结构和损失函数对YOLOX进行改进,来提高检测船舶的能力。这些方法所使用的YOLO系列模型计算量大,对设备内存要求高,将其应用于水面移动平台时具有较大挑战性。因此,需要发掘计算量更小的优秀模型应用于水面移动平台上的目标检测。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的缺陷,提供一种改进的Efficientdet水面目标检测方法及其系统。采用结构简洁、计算量小的单阶段高效检测Efficientdet模型,将Efficientdet

D0作为初始模型,针对Efficientdet

D0模型在水面目标检测的精度以及模型的漏检率进行改进,使其在复杂时变的水面环境中进行目标检测时,能够取得较高的检测精度和较低的漏检率。
[0006]为实现上述技术目的,本专利技术采用以下技术方案。
[0007]本专利技术的一种基于改进的Efficientdet的水面目标检测方法,包括以下步骤:
[0008]步骤一、将挑战性水面数据集WSODD以VOC格式存储在算法目录下,并按照8:1:1的比例划分训练集、测试集、验证集,划分好的图片信息用.txt格式存放;
[0009]步骤二、将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中
训练,从中提取P3

P5级特征;其中,在主干特征提取网络Efficientnet的2

8层的每层MBConv中引入注意力机制CA,得到CA

MBConv;
[0010]步骤三、将主干特征提取网络输出的P3

P5级特征经过1
×
1卷积生成P3_in到P5_in,再将P5_in经过两次下采样得到P6_in、P7_in;再将P3_in到P7_in输入到特征融合网络Cot

BIFPN中,使特征经由三次自上而下和自下而上的特征融合;其中,在特征融合网络BIFPN的卷积操作Conv7_down到Conv4_down、Conv3_up到Conv6_up中引入Cot模块,得到Cot

BIFPN;
[0011]步骤四、将特征融合网络Cot

BIFPN输出的五个有效特征层P3_out到P7_out传输到ClassNet+BoxNet中,获得最终检测结果;其中,将ClassNet、BoxNet中的激活函数替换为H

Swish;
[0012]步骤五、将改进后的Efficientdet模型用WSODD训练集进行训练,epoch参数从300

650以50为间隔取值,每个训练结果的权值文件均以.pth格式存放,使用WSODD测试集对所有权值文件进行mAP计算;对比epoch取值与mAP的关系,得到最优epoch取值;其中,epoch=500时mAP最高,可达48.00%,因此选取500为改进后模型epoch的取值;
[0013]步骤六、从WSODD验证集中选取两张真实水面环境拍摄的图片,分别输入到原始Efficientdet和改进后的Efficientdet模型中进行检测,并对比检测结果。
[0014]具体地,所述步骤二中,将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练,从中提取P3

P5级特征;在主干特征提取网络2

8层的每层MBConv中引入注意力机制CA,得到CA

MBConv,其实现步骤如下:
[0015]S2.1将输入的特征图经过1
×
1卷积升维,增加输入的通道数;
[0016]S2.2将经过升维的特征图输入到深度可分离卷积DepthwiseConv中;
[0017]S2.2.1对特征图进行分组,每一组都进行3
×
3卷积操作,收集每个通道的空间特征;
[0018]S2.2.2将经过卷积操作的各组特征图输入到1
×
1卷积中,构造各组3
×
3卷积的线性组合,收集每个点的特征;
[0019]S2.3将经过深度可分离卷积后的特征图输入到CA模块中,获得通道之间的相关性信息和空间特征点的位置信息:
[0020]S2.3.1首先对输入的特征图进行坐标信息编码Coordinate information embedding;
[0021]S2.3.1.1输入经过深度可分离卷积后C
×
H
×
W的特征图x,其中C、H、W分别代表通道数、特征图高、特征图宽;
[0022]S2.3.1.2将特征图x经过(H,1)或(1,W)尺寸的池化核,使每个通道的信息分别沿着水平和垂直方向进行编码,高度为h的第c个通道输出为:
[0023][0024]宽度为w的第c个通道输出为:
[0025][0026]其中,x
c
表示第c个通道的特征映射;i,j表示循环变量;
[0027]S2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于改进的Efficientdet的水面目标检测方法,其特征在于,包括以下步骤:步骤一、将挑战性水面数据集WSODD以VOC格式存储在算法目录下,并按照8:1:1的比例划分训练集、测试集、验证集,划分好的图片信息用.txt格式存放;步骤二、将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练,从中提取P3

P5级特征;其中,在主干特征提取网络Efficientnet的2

8层的每层MBConv中引入注意力机制CA,得到CA

MBConv;步骤三、将主干特征提取网络输出的P3

P5级特征经过1
×
1卷积生成P3_in到P5_in,再将P5_in经过两次下采样得到P6_in、P7_in;再将P3_in到P7_in输入到特征融合网络Cot

BIFPN中,使特征经由三次自上而下和自下而上的特征融合;其中,在特征融合网络BIFPN的卷积操作Conv7_down到Conv4_down、Conv3_up到Conv6_up中引入Cot模块,得到Cot

BIFPN;步骤四、将特征融合网络Cot

BIFPN输出的五个有效特征层P3_out到P7_out传输到ClassNet+BoxNet中,获得最终检测结果;其中,将ClassNet、BoxNet中的激活函数替换为H

Swish;步骤五、将改进后的Efficientdet模型用WSODD训练集进行训练,epoch参数从300

650以50为间隔取值,每个训练结果的权值文件均以.pth格式存放,使用WSODD测试集对所有权值文件进行mAP计算;对比epoch取值与mAP的关系,得到最优epoch取值;其中,epoch=500时mAP最高,可达48.00%,因此选取500为改进后模型epoch的取值;步骤六、从WSODD验证集中选取两张真实水面环境拍摄的图片,分别输入到原始Efficientdet和改进后的Efficientdet模型中进行检测,并对比检测结果。2.根据权利要求1所述的一种基于改进的Efficientdet的水面目标检测方法,其特征在于,所述步骤二中,将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练,从中提取P3

P5级特征;在主干特征提取网络2

8层的每层MBConv中引入注意力机制CA,得到CA

MBConv,其实现步骤如下:S2.1将输入的特征图经过1
×
1卷积升维,增加输入的通道数;S2.2将经过升维的特征图输入到深度可分离卷积DepthwiseConv中;S2.2.1对特征图进行分组,每一组都进行3
×
3卷积操作,收集每个通道的空间特征;S2.2.2将经过卷积操作的各组特征图输入到1
×
1卷积中,构造各组3
×
3卷积的线性组合,收集每个点的特征;S2.3将经过深度可分离卷积后的特征图输入到CA模块中,获得通道之间的相关性信息和空间特征点的位置信息:S2.3.1首先对输入的特征图进行坐标信息编码Coordinate information embedding;S2.3.1.1输入经过深度可分离卷积后C
×
H
×
W的特征图x,其中C、H、W分别代表通道数、特征图高、特征图宽;S2.3.1.2将特征图x经过(H,1)或(1,W)尺寸的池化核,使每个通道的信息分别沿着水平和垂直方向进行编码,高度为h的第c个通道输出为:宽度为w的第c个通道输出为:
其中,x
c
表示第c个通道的特征映射;i,j表示循环变量;S2.3.1.3将经过编码的信息按照水平和垂直方向聚合特征,输出一对含有方向感知的特征图,获得全局感受野并将精确的位置信息编码,提高网络对感兴趣目标检测的精度;S2.3.2再将经过坐标信息编码的特征图输入到坐标注意力生成Coordinate attention generation中;S2.3.2.1将水平和垂直方向上输出的特征图y
h
和y
w
进行串联编码,使用1
×
1卷积进行操作,用F1表示,输出f表示在水平和垂直方向的中间特征...

【专利技术属性】
技术研发人员:马赛解志斌邵长斌张金波
申请(专利权)人:江苏科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1