目标检测模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：43812150 阅读：3 留言：0更新日期：2024-12-27 13:27

本申请提供一种目标检测模型训练方法、装置、电子设备及存储介质，涉及计算机处理技术领域。方法包括：获取用于模型训练的数据集，将数据集输入待训练的初始检测模型中的特征提取网络，以对样本图像进行多尺度特征提取和注意力特征提取，得到每个样本图像对应的多个多尺度特征图；将各个多尺度特征图输入初始检测模型中的检测头，得到样本图像对应的检测结果，然后获取检测结果中每个待检测目标和每个待检测目标对应的真实目标之间的损失值，判断损失值是否满足预设模型收敛条件，若满足，则将满足预设模型收敛条件的初始检测模型作为目标检测模型。如此，可以改善传统目标识别类模型对视频卫星图像中的小目标检测精度低、效果差的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机处理，具体而言，涉及一种目标检测模型训练方法、装置、电子设备及存储介质。

技术介绍

1、视频卫星在监测、导航、资源管理等领域发挥着重要作用，视频卫星图像中的小目标检测是视频卫星图像目标识别中的一项关键任务，作为计算机视觉领域中的热点和难点问题，尤其对于视频卫星图像，由于拍摄距离较远，地面目标自身分辨率较低，目标在图像中所占的像素较少，并受到复杂背景因素的干扰，直接从输入图像中准确地检测微小目标变得非常困难。

2、目前用于小目标检测的网络模型通常采用注意力机制来提升模型对小目标检测的性能，例如se(squeeze-and-excitation)、eca(efficient channel attention)、cbam(convolutional block attention module)、sge(spatial group-wise enhance)、ema(efficient multi-scale attention)等等。现有的注意力机制对于特征提取考虑的层面不够充分，存在微小目标检测精度低、效果差的问题。

技术实现思路

1、有鉴于此，本申请实施例的目的在于提供一种目标检测模型训练方法、装置、电子设备及存储介质，能够改善传统目标识别类模型对视频卫星图像中的小目标检测精度低、效果差的问题。

2、为实现上述技术目的，本申请采用的技术方案如下：

3、第一方面，本申请实施例提供了一种目标检测模型训练方法，所述方法包括：>

4、获取用于模型训练的数据集，所述数据集包括多个样本图像和每个样本图像对应的真实目标的类型和坐标；

5、将所述数据集输入待训练的初始检测模型中的特征提取网络，对于每个所述样本图像，通过所述特征提取网络对所述样本图像进行多尺度特征提取和注意力特征提取，得到每个所述样本图像对应的多个多尺度特征图；

6、对于每个所述样本图像，将各个所述多尺度特征图输入所述初始检测模型中的检测头，以得到所述样本图像对应的检测结果，所述检测结果包括所述样本图像中的待检测目标的类型和坐标；

7、计算每个所述待检测目标和每个所述待检测目标的类别和坐标与对应的所述真实目标的类型和坐标之间的损失值，所述损失值表征所述待检测目标与所述真实目标的误差；

8、判断所述损失值是否满足预设模型收敛条件，若所述损失值满足所述预设模型收敛条件，则将满足所述预设模型收敛条件的所述初始检测模型作为目标检测模型，若所述损失值不满足所述预设模型收敛条件，则调整所述初始检测模型的参数，并按照调整后的参数训练所述初始检测模型，直到所述损失值满足所述预设模型收敛条件。

9、结合第一方面，在一些可选的实施方式中，将所述数据集输入待训练的初始检测模型中的特征提取网络，对于每个所述样本图像，通过所述特征提取网络对所述样本图像进行多尺度特征提取和注意力特征提取，得到每个所述样本图像对应的多个多尺度特征图，包括：

10、通过所述骨干网络模块提取所述样本图像中的不同尺度的特征图；

11、确定所述不同尺度的特征图中，携带有所述待检测目标的语义特征的特征图作为目标特征图，并将各个所述目标特征图输入所述特征提取网络中的颈部网络模块，以通过所述颈部网络模块中的pafpn结构增强所述目标特征图的浅层特征，得到每个所述目标特征图像对应的增强后的目标特征图；

12、对于每个所述增强后的目标特征图，将所述增强后的目标特征图输入所述颈部网络模块中的三叉戟空间融合注意力子模块，以通过所述三叉戟空间融合注意力子模块对所述增强后的目标特征图进行特征提取，得到每个所述增强后的目标特征图对应的多尺度特征图。

13、结合第一方面，在一些可选的实施方式中，对于每个所述样本图像，所述三叉戟空间注意力子模块包括3个空间注意力模块、1个concatenate层和1个cbs模块；

14、对于每个所述增强后的目标特征图，将所述增强后的目标特征图输入所述颈部网络模块中的三叉戟空间融合注意力子模块，以通过所述三叉戟空间融合注意力子模块对所述增强后的目标特征图进行特征提取，得到每个所述增强后的目标特征图对应的多尺度特征图，包括：

15、通过3个所述空间注意力模块，对所述增强后的目标特征图中的不同维度进行特征提取，得到每个维度对应的特征信息；

16、通过所述concatenate层对所有特征信息进行张量拼接，并通过所述cbs模块输出，得到所述多尺度特征图。

17、结合第一方面，在一些可选的实施方式中，每个所述空间注意力模块分别包括第一池化层、第二池化层、第一卷积层和第一激活函数；

18、通过3个所述空间注意力模块，对所述增强后的目标特征图中的不同维度进行特征提取，得到每个维度对应的特征信息，包括：

19、对所述增强后的目标特征图进行形状变换，得到三张不同形状的特征图；

20、将所述三张不同形状的特征图分别输入每个所述空间注意力模块的第一池化层进行最大池化操作，得到每个所述特征图对应的第一特征图；

21、将所述三张不同形状的特征图分别输入每个所述空间注意力模块的第二池化层进行平均池化操作，得到每个所述特征图对应的第二特征图；

22、对于每个所述空间注意力模块，将所述第一特征图和所述第二特征图进行张量拼接，得到第三特征图；

23、将所述第三特征图输入每个所述空间注意力模块的第一卷积层进行深度卷积，并通过所述第一激活函数计算得到深度卷积后的所述第三特征图对应的权重系数；

24、将所述权重系数与所述增强后的目标特征图相乘，得到所述特征信息。

25、结合第一方面，在一些可选的实施方式中，计算每个所述待检测目标的类别和坐标与对应的所述真实目标的类型和坐标之间的损失值，包括：

26、通过所述初始检测模型的损失函数确定所述损失值，其中，所述损失值的计算公式如下：

27、

28、

29、

30、

31、式中，ciouloss表示损失值，iou表示预测框b与标注的真值框bgt的交并比，ρ2(b，bgt)表示预测框的中心点b与真值框的中心点bgt的欧氏距离，c表示能同时包含预测框和真值框的最小包闭区域的对角线距离，α表示权重系数，v表示预测框和真值框的长宽比的相似性，w表示预测框的宽，h表示预测框的高，wgt表示真值框的宽，hgt表示真值框的高。

32、结合第一方面，在一些可选的实施方式中，所述方法还包括：

33、获取待识别图像；

34、将所述待识别图像输入所述目标检测模型，以识别所述待识别图像中的待识别目标的目标类型。

35、结合第一方面，在一些可选的实施方式中，在获取用于模型训练的数据集之前，所述方法还包括：

36、获取样本图像集；

37、对所述样本图像集中的每个初始样本图像进行本文档来自技高网...

【技术保护点】

1.一种目标检测模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，将所述数据集输入待训练的初始检测模型中的特征提取网络，对于每个所述样本图像，通过所述特征提取网络对所述样本图像进行多尺度特征提取和注意力特征提取，得到每个所述样本图像对应的多个多尺度特征图，包括：

3.根据权利要求2所述的方法，其特征在于，对于每个所述样本图像，所述三叉戟空间注意力子模块包括3个空间注意力模块、1个concatenate层和1个CBS模块；

4.根据权利要求3所述的方法，其特征在于，每个所述空间注意力模块分别包括第一池化层、第二池化层、第一卷积层和第一激活函数；

5.根据权利要求1所述的方法，其特征在于，计算每个所述待检测目标的类别和坐标与对应的所述真实目标的类型和坐标之间的损失值，包括：

6.根据权利要求1所述的方法，其特征在于，所述方法还包括：

7.根据权利要求1所述的方法，其特征在于，在获取用于模型训练的数据集之前，所述方法还包括：

8.一种目标检测模型训练装置，其特征在于，所述装置包括：

9.一种电子设备，其特征在于，所述电子设备包括相互耦合的处理器及存储器，所述存储器内存储计算机程序，当所述计算机程序被所述处理器执行时，使得所述电子设备执行如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质中存储有计算机程序，当所述计算机程序在计算机上运行时，使得所述计算机执行如权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种目标检测模型训练方法，其特征在于，所述方法包括：

3.根据权利要求2所述的方法，其特征在于，对于每个所述样本图像，所述三叉戟空间注意力子模块包括3个空间注意力模块、1个concatenate层和1个cbs模块；

4.根据权利要求3所述的方法，其特征在于，每个所述空间注意力模块分别包括第一池化层、第二池化层、第一卷积层和第一激活函数；

5.根据权利要求1所述的方法，其特征在于，计算每个所述待检测目标的类...

【专利技术属性】
技术研发人员：卢涛，郎秀娟，汪家明，张显鸿，张彦铎，朱柏霖，
申请(专利权)人：武汉工程大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人