一种面向复杂场景的船号识别方法与系统技术方案

技术编号：44737838 阅读：5 留言：0更新日期：2025-03-21 18:04

本发明专利技术属于图像识别技术领域，公开了一种面向复杂场景的船号识别方法与系统，通过C2f_IRMB_DRB模块对船舶图像数据集的图像特征进行增强，并且将学习型位置编码LPE引入AIFI_LPE模块中，并基于增强图像特征后的船舶图像数据集，获取新船号特征；根据新船号特征，以及自注意力机制、MultiHead多头自注意力机制、LayerNorm层和前馈神经网络FFN，获取经过进一步增强的图像区域；对增强的图像区域进行识别，得到船舶的船号。本发明专利技术在复杂海洋环境下展现出更高的鲁棒性与稳定性，能够确保特征提取和识别的精度，适用于海上船舶监测和管理应用。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于图像识别，涉及一种面向复杂场景的船号识别方法与系统。

技术介绍

1、随着全球海上贸易的快速增长以及海洋监视与安全管理需求的日益迫切，快速、准确地识别船只身份已成为海上管理的重要环节之一。船号作为船只身份的关键标识，其识别技术的准确性和效率在海洋监控和执法活动中具有重要意义。然而，现有的船号识别技术在面对复杂的海洋环境时，仍然存在诸多挑战，亟待改进。

2、目前，船号识别技术主要面临以下几个问题：首先，船号通常位于船体的不同位置，且在不同类型的船只上，船号的尺寸和长度存在较大差异。这种不规则性增加了自动化检测和识别的难度。其次，恶劣的天气条件、复杂的海面环境以及船只运动带来的视觉模糊和遮挡问题，均会显著影响船号的识别精度。此外，现有的船号数据集较为稀缺，导致相关研究在数据支撑方面存在一定的局限性，进一步增加了技术发展的难度。

3、早期的研究多采用经典的深度卷积神经网络dcnn进行船号识别。例如，一些基于目标检测与字符识别的模型结构已被提出，尽管这些方法在单一场景中表现较好，但在面对复杂环境时，往往缺乏足够的鲁棒性。此外，近年，有学者提出了一些改进方法，如采用基于透视变换的字符检测与识别算法，以提高低分辨率船号的识别精度。然而，这些方法多数只针对检测或识别单一环节进行优化，未能在检测和识别过程间形成良好的协同效果。同时，针对复杂场景下的遮挡、模糊等问题，现有的解决方案仍有局限性，多数技术在处理船号的多变外观和模糊场景时表现不足，无法满足实际海洋环境中船号识别的应用需求。

>技术实现思路

1、本专利技术的目的在于解决现有技术中只针对检测或识别单一环节进行优化，未能在检测和识别过程间形成良好的协同效果；同时，针对复杂场景下的遮挡、模糊等问题，多数技术在处理船号的多变外观和模糊场景时表现不足，无法满足实际海洋环境中船号识别的应用需求的问题，提供一种面向复杂场景的船号识别方法与系统。

2、为达到上述目的，本专利技术采用以下技术方案予以实现：

3、一种面向复杂场景的船号识别方法，包括：

4、基于所采集港口中的船舶视频，获取含有若干张船号信息的船舶图像，构建船舶图像数据集；

5、基于反向残差移动块网络irmb和drb网络，构建c2f_irmb_drb模块；

6、基于c2f_irmb_drb模块对船舶图像数据集的图像特征进行增强；

7、将学习型位置编码lpe引入aifi_lpe模块中，并基于增强图像特征后的船舶图像数据集，获取包含位置信息的新船号特征；

8、基于包含位置信息的新船号特征，以及自注意力机制、multihead多头自注意力机制、layernorm层和前馈神经网络ffn，获取经过进一步增强的图像区域；

9、对经过进一步增强的图像区域进行识别，得到船舶的船号。

10、本专利技术的进一步改进在于：

11、进一步的，基于所采集港口中的船舶视频，获取含有若干张船号信息的船舶图像，构建船舶图像数据集，具体为：基于labelimg软件对船舶数据集进行船牌标注，并且通过paddlelabel软件对每张图像的船号进行标记，得到包含所有船号信息的txt文件，每一行记录了图像的地址和对应的船名信息。

12、进一步的，基于c2f_irmb_drb模块对船舶图像数据集的图像特征进行增强，具体为：

13、irmb_drb模块通过输出/输入比为λ的扩展mlpe扩展通道维度；

14、基于扩展窗口多头注意力机制ew-mhsa和irmb_drb模块中的drb_dw-conv对图像特征进一步增强；

15、基于反向输入/输出比等于λ的收缩mlps收缩通道尺寸，根据残差连接得到最终输出。

16、进一步的，irmb_drb模块通过输出/输入比为λ的扩展mlpe扩展通道维度，具体为：

17、xe＝mlpe(x)＝v (1)

18、其中，x为船号图像；x＝q＝k；v、q、k为不同的矩阵；

19、所述基于扩展窗口多头注意力机制ew-mhsa和irmb_drb模块中的drb_dw-conv对图像特征进一步增强，具体为：

20、xf＝(drb_dw-conv(xe),skip)(ew-mhsa(xe)) (2)

21、其中，skip为跳跃连接；

22、所述基于反向输入/输出比等于λ的收缩mlps收缩通道尺寸，具体为：

23、xs＝mlps(xf) (3)

24、所述根据残差连接得到最终输出，具体为：

25、y＝x+xs (4)

26、进一步的，将学习型位置编码lpe引入aifi_lpe模块中，并基于增强图像特征后的船舶图像数据集，获取包含位置信息的新船号特征，具体为：

27、将输入的船号特征x与学习型位置编码lpe相结合，生成包含位置信息p的新特征，如公式(5)所示：

28、x′＝x+p (5)

29、在得到包含位置信息p的新特征x′后，通过线性变换得到q、k、v，如公式(6)所示：

30、q＝x′wq，k＝x′wk，v＝x′wv (6)

31、其中，wq是查询权重矩阵，用于将输入特征x映射到查询矩阵q；wk是键权重矩阵，用于将输入特征x映射到键矩阵k；wv是值权重矩阵，用于将输入特征x映射到值矩阵v。

32、进一步的，基于包含位置信息的新船号特征，以及自注意力机制、multihead多头自注意力机制、layernorm层和前馈神经网络ffn，获取经过进一步增强的图像区域，具体为：

33、在新的特征表示x′上应用自注意力机制，计算注意力分布并加权求和得到自注意力输出，公式如式(7)所示：

34、

35、其中，softmax()为归一化处理，dk为键矩阵k的维度，kt为键矩阵k的转置；

36、基于multihead多头自注意力机制将多个自注意力头的输出进行拼接，经过线性变换，模型能够在不同的子空间中并行地关注不同的信息；公式如式(8)所示：

37、multihead(q,k,v)＝concat(head1，head2，…,headh)wo (8)

38、其中，wo为权重矩阵，每个头的计算为：

39、

40、基于layernorm层归一化和残差连接，确保捕捉到复杂场景中的细节信息公式如式(9)所示：

41、attentionoutput＝layernorm(x′+multihead(q,k,v)) (9)

42、基于前馈神经网络ffn增强模型的非线性表达能力，并再次通过层归一化和残差连接得到最终输出，如公式(10)所示：

43、output＝layernorm(attentionoutput+ffn(attent本文档来自技高网...

【技术保护点】

1.一种面向复杂场景的船号识别方法，其特征在于，包括：

2.根据权利要求1所述的面向复杂场景的船号识别方法，其特征在于，所述基于所采集港口中的船舶视频，获取含有若干张船号信息的船舶图像，构建船舶图像数据集，具体为：基于labelimg软件对船舶数据集进行船牌标注，并且通过PaddleLabel软件对每张图像的船号进行标记，得到包含所有船号信息的txt文件，每一行记录了图像的地址和对应的船名信息。

3.根据权利要求2所述的面向复杂场景的船号识别方法，其特征在于，所述基于C2f_IRMB_DRB模块对船舶图像数据集的图像特征进行增强，具体为：

4.根据权利要求3所述的面向复杂场景的船号识别方法，其特征在于，所述IRMB_DRB模块通过输出/输入比为λ的扩展MLPe扩展通道维度，具体为：

5.根据权利要求4所述的面向复杂场景的船号识别方法，其特征在于，所述将学习型位置编码LPE引入AIFI_LPE模块中，并基于增强图像特征后的船舶图像数据集，获取包含位置信息的新船号特征，具体为：

6.根据权利要求5所述的面向复杂场景的船号识别

7.根据权利要求6所述的面向复杂场景的船号识别方法，其特征在于，所述对经过进一步增强的图像区域进行识别，得到船舶的船号，具体为：

8.根据权利要求7所述的面向复杂场景的船号识别方法，其特征在于，所述对于低质量图像进行高斯模糊处理原始图像，具体为：

9.根据权利要求8所述的面向复杂场景的船号识别方法，其特征在于，所述基于TPS变换算法，将增强后图像和清晰图像的控制点进行映射，具体为：

10.一种面向复杂场景的船号识别系统，其特征在于，包括：

...

【技术特征摘要】

1.一种面向复杂场景的船号识别方法，其特征在于，包括：

2.根据权利要求1所述的面向复杂场景的船号识别方法，其特征在于，所述基于所采集港口中的船舶视频，获取含有若干张船号信息的船舶图像，构建船舶图像数据集，具体为：基于labelimg软件对船舶数据集进行船牌标注，并且通过paddlelabel软件对每张图像的船号进行标记，得到包含所有船号信息的txt文件，每一行记录了图像的地址和对应的船名信息。

3.根据权利要求2所述的面向复杂场景的船号识别方法，其特征在于，所述基于c2f_irmb_drb模块对船舶图像数据集的图像特征进行增强，具体为：

4.根据权利要求3所述的面向复杂场景的船号识别方法，其特征在于，所述irmb_drb模块通过输出/输入比为λ的扩展mlpe扩展通道维度，具体为：

5.根据权利要求4所述的面向复杂场景的船号识别方法，其特征在于，所述将学习型位置编码lpe引入a...

【专利技术属性】
技术研发人员：胡祝华，魏天娇，赵瑶池，吴伟，黄拔，覃善兴，王艺臻，李海涛，
申请(专利权)人：海南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人