一种图像自适应船舶检测方法、装置及存储介质制造方法及图纸

技术编号：34385518 阅读：26 留言：0更新日期：2022-08-03 21:07

本发明专利技术公开了一种图像自适应船舶检测方法、装置及存储介质，方法包括：获取船舶数据集；对船舶数据集进行扩充；对扩充后的船舶数据集中的图像进行预处理；将所述预处理后的扩充船舶数据集中的图像进行自适应增强，得到处理好的船舶数据集；将所述处理好的船舶数据集输入预构建的基于Mobile

全部详细技术资料下载

【技术实现步骤摘要】
一种图像自适应船舶检测方法、装置及存储介质

[0001]本专利技术属于计算机视觉
，涉及一种图像自适应船舶检测方法、装置及存储介质，具体涉及一种基于改进Mobile
‑
Former的图像自适应船舶检测方法、装置及存储介质。

技术介绍

[0002]近些年，随着计算机视觉技术在目标识别跟踪上取得的研究进展和成果，基于计算机视觉的船舶监管系统作为上述监管设备在船舶监管领域的补充，具有十分重要的应用价值。基于计算机视觉的船舶监管系统作为AIS和雷达设备的补充，可以进一步完善对水上船舶目标的监管。因此采用智能化的监管手段是海事部门提高船舶监管能力的必不可少的手段，而高效智能的监管的前提是对水面目标进行准确的检测。
[0003]最近，vision transformer(ViT)展示了全局处理的优势，并实现了与CNNs相比的显著性能提升。然而，当将计算预算限制在1G FLOPs以内时，ViT的增益减小。如果我们进一步挑战计算成本，MobileNet和它的扩展仍然占据着它们的地盘(例如，ImageNet分类的FLOPs少于300M)，因为它们通过分解深度和点卷积在局部处理过滤器中的效率很高。一个简单的想法是将卷积和视觉转换器结合起来。许多作品显示了将卷积和视觉transformer串联起来的好处，可以在一开始使用卷积，也可以将卷积加入到每个transformer中。
[0004]另外，由于输入图像的领域偏移，一般的高质量图像训练的目标检测模型在恶劣的天气条件下(如大雾和暗光)往往不能获得满意...

【技术保护点】

【技术特征摘要】
1.一种图像自适应船舶检测方法，其特征在于，包括：获取船舶数据集；对船舶数据集进行扩充，得到扩充后的船舶数据集；对扩充后的船舶数据集中的图像进行预处理，得到预处理后的扩充船舶数据集；将所述预处理后的扩充船舶数据集中的图像进行自适应增强，得到处理好的船舶数据集；将所述处理好的船舶数据集输入预构建的基于Mobile
‑
Former的检测模型，得到输出的船舶目标检测结果。2.根据权利要求1所述的图像自适应船舶检测方法，其特征在于，对船舶数据集进行扩充，包括至少以下方法中的任一种：水平翻转：采用水平翻转的方式对船舶数据集进行扩充；缩放：对原始船舶数据集进行缩放处理；旋转：对船舶数据集进行一定角度的旋转处理；仿射变换：将船舶数据集中的图像从二维坐标(x,y)对应到另一个二维坐标(u,v)的线性变换，由平移、缩放、旋转操作组合而成。3.根据权利要求1所述的图像自适应船舶检测方法，其特征在于，所述对扩充后的船舶数据集中的图像进行预处理，包括图像灰度处理和高斯平滑处理。4.根据权利要求3所述的图像自适应船舶检测方法，其特征在于，图像灰度处理，包括：对图像每一点像素进行灰度化，并引入gamma系数进行校正，根据经验gamma通常取值为2.2，计算公式如下：其中，Gray(i,j)为图像灰度化后的像素点，某个像素点在矩阵中的位置坐标表示为(i,j))，Wr、Wg、Wb分别为三原色的权值。5.根据权利要求3所述的图像自适应船舶检测方法，其特征在于，高斯平滑处理，包括：其中，G(x,y)为图像高斯平滑处理后的像素点，(x,y)为像素点坐标，σ为标准差。6.根据权利要求1所述的图像自适应船舶检测方法，其特征在于，将所述预处理后的扩充船舶数据集中的图像进行自适应增强，包括：将所述预处理后的扩充船舶数据集中的图像输入DIP模块进行自适应增强；其中所述DIP模块包括六个可微滤波器，具有可调超参数，包括Defog、White Balance(WB)、Gamma、Contrast、Tone和Sharpen；所述可调超参数使用小型卷积神经网络CNN
‑
PP预测得到，所述CNN
‑
PP包括卷积块和全连接层，每个卷积块包括一个带有stride＝2的3
×
3卷积层和一个LeakyRelu，全连接层输出DIP模块的所述可调超参数。7.根据权利要求1所述的图像自适应船舶检测方法，其特征在于，基于Mobile
‑
Former的检测模型的构建方法包括：所述检测模型包括主干网络和检测头，均包含有Mobile
‑
Former模块；其中Mobile
‑
Former模块包括Mobile子模块、Mobile
→
Former桥、Former子模块和Mobile
←
Former桥；构建Mobile子模块，Mobile子模块以图像作为输入在第一次逐点卷积后，用动态ReLU代替ReLU作为激活函数，然后经过3
×
3深度卷积后，再用动态ReLU代替ReLU作为激活函数；其中两个动态ReLU的参数均是将former子模块中得到的全局tokens应用两个MLP层得到，最后通过一个逐点卷积实现Mobile子模块的输出，表示为X
hidden
，作为Mobile
←
Former的输入；构建Mobile
→
Former桥，用于将局部特征X
i
融合到全局tokens Z中：Mobile
→
Former桥以局部特征X
i
作为输入，结合设定的全局tokens Z
i
，计算局部和全局特征之间的交叉关注，并为每个全局tokens聚集局部特征，将全局特征投影到局部特征的同一维度，并在聚合后投影回维度d；Mobile
→
Former的输出表示为Z
hidden...

【专利技术属性】
技术研发人员：梁正和，孙泽云，
申请(专利权)人：河海大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人