【技术实现步骤摘要】
一种基于改进的Efficientdet的水面目标检测方法及其系统
[0001]本专利技术属于水面目标检测
,具体涉及一种基于改进的Efficientdet的水面目标检测方法及其系统。
技术介绍
[0002]在当前世界背景下,海洋安全是国家安全的重点方向,也是国防和民生安全的重中之重。检测海上目标图像重要信息,属于水面目标检测
水面目标检测技术的发展对于军用海湾、港口的管理和民用捕鱼船只的监管等都有着深远意义,是实现海洋安全的一种重要途径。水面目标检测系统可分为远距离系统和近距离系统,远距离系统主要是雷达、红外目标探测,近距离系统主要是视觉采集和探测。由于远距离系统作用距离较远,获取到的图像信息量少,已经不能满足国防安全的需要,因此近距离系统成为了目前水面目标检测技术的热门选择。
[0003]近年来,随着深度学习在人工智能背景下的迅速发展,将其应用到近距离系统中来提高水面目标检测精度的进程刻不容缓。海洋相比于陆地条件更加恶劣,存在水面折射、天气多变、设备不稳定等多种因素,因此,水面目标检测模型的信息处理能力和信息检测精度,决定了能否在复杂时变的水面环境中准确地检测到水面目标。
[0004]目前,深度学习目标检测模型层出不穷,其中单阶段检测模型中最经典的是YOLO系列,中国专利申请(CN109492561A)公开了一种基于改进YOLOV2模型的光学遥感图像舰船检测方法,通过修正损失函数来提高YOLOV2对舰船的检测能力。《2022 2nd International Conference o ...
【技术保护点】
【技术特征摘要】
1.一种基于改进的Efficientdet的水面目标检测方法,其特征在于,包括以下步骤:步骤一、将挑战性水面数据集WSODD以VOC格式存储在算法目录下,并按照8:1:1的比例划分训练集、测试集、验证集,划分好的图片信息用.txt格式存放;步骤二、将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练,从中提取P3
‑
P5级特征;其中,在主干特征提取网络Efficientnet的2
‑
8层的每层MBConv中引入注意力机制CA,得到CA
‑
MBConv;步骤三、将主干特征提取网络输出的P3
‑
P5级特征经过1
×
1卷积生成P3_in到P5_in,再将P5_in经过两次下采样得到P6_in、P7_in;再将P3_in到P7_in输入到特征融合网络Cot
‑
BIFPN中,使特征经由三次自上而下和自下而上的特征融合;其中,在特征融合网络BIFPN的卷积操作Conv7_down到Conv4_down、Conv3_up到Conv6_up中引入Cot模块,得到Cot
‑
BIFPN;步骤四、将特征融合网络Cot
‑
BIFPN输出的五个有效特征层P3_out到P7_out传输到ClassNet+BoxNet中,获得最终检测结果;其中,将ClassNet、BoxNet中的激活函数替换为H
‑
Swish;步骤五、将改进后的Efficientdet模型用WSODD训练集进行训练,epoch参数从300
‑
650以50为间隔取值,每个训练结果的权值文件均以.pth格式存放,使用WSODD测试集对所有权值文件进行mAP计算;对比epoch取值与mAP的关系,得到最优epoch取值;其中,epoch=500时mAP最高,可达48.00%,因此选取500为改进后模型epoch的取值;步骤六、从WSODD验证集中选取两张真实水面环境拍摄的图片,分别输入到原始Efficientdet和改进后的Efficientdet模型中进行检测,并对比检测结果。2.根据权利要求1所述的一种基于改进的Efficientdet的水面目标检测方法,其特征在于,所述步骤二中,将训练集图片输入到引入CA模块后的主干特征提取网络Efficientnet中训练,从中提取P3
‑
P5级特征;在主干特征提取网络2
‑
8层的每层MBConv中引入注意力机制CA,得到CA
‑
MBConv,其实现步骤如下:S2.1将输入的特征图经过1
×
1卷积升维,增加输入的通道数;S2.2将经过升维的特征图输入到深度可分离卷积DepthwiseConv中;S2.2.1对特征图进行分组,每一组都进行3
×
3卷积操作,收集每个通道的空间特征;S2.2.2将经过卷积操作的各组特征图输入到1
×
1卷积中,构造各组3
×
3卷积的线性组合,收集每个点的特征;S2.3将经过深度可分离卷积后的特征图输入到CA模块中,获得通道之间的相关性信息和空间特征点的位置信息:S2.3.1首先对输入的特征图进行坐标信息编码Coordinate information embedding;S2.3.1.1输入经过深度可分离卷积后C
×
H
×
W的特征图x,其中C、H、W分别代表通道数、特征图高、特征图宽;S2.3.1.2将特征图x经过(H,1)或(1,W)尺寸的池化核,使每个通道的信息分别沿着水平和垂直方向进行编码,高度为h的第c个通道输出为:宽度为w的第c个通道输出为:
其中,x
c
表示第c个通道的特征映射;i,j表示循环变量;S2.3.1.3将经过编码的信息按照水平和垂直方向聚合特征,输出一对含有方向感知的特征图,获得全局感受野并将精确的位置信息编码,提高网络对感兴趣目标检测的精度;S2.3.2再将经过坐标信息编码的特征图输入到坐标注意力生成Coordinate attention generation中;S2.3.2.1将水平和垂直方向上输出的特征图y
h
和y
w
进行串联编码,使用1
×
1卷积进行操作,用F1表示,输出f表示在水平和垂直方向的中间特征...
【专利技术属性】
技术研发人员:马赛,解志斌,邵长斌,张金波,
申请(专利权)人:江苏科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。