目标检测方法、系统、设备以及介质技术方案

技术编号：42313946 阅读：18 留言：0更新日期：2024-08-14 15:57

本发明专利技术公开了一种目标检测方法、系统、计算机设备以及介质，包括步骤：基于输入图像的特征图得到多个维度的第一图像特征图；将多个维度的所述第一图像特征图分别进行编码并拼接得到第二图像特征图；基于所述第二图像特征图得到第一权重和第二权重；利用所述第一权重和所述第二权重对所述输入图像的特征图进行计算得到第三图像特征图，基于第三图像特征图进行目标检测。本发明专利技术提出的方案通过在多个维度进行图像语义特征提取，提高了语义信息的丰富度，进而提高了目标检测的准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像目标检测领域，具体涉及一种目标检测方法、系统、设备以及介质。

技术介绍

1、在进行图像目标检测时，常见的手段是基于卷积神经网络进行检测，而随着深度学习技术的发展，目标检测也逐渐向着自动学习方向发展，例如在引入注意力机制后，模型可以根据图像内容自动调整对不同区域的关注程度，从而更有效地检测出目标。

2、但是常见的基于注意力机制检测算法，例如senet (squeeze-and-excitationnetwork)、vit（visual transformer），通常仅从单一维度进行特征提取，但是从单一维度提取的语义特征不够丰富，对于背景复杂的目标检测并没有很好的鲁棒性，导致检测准确率和召回率也相对较低。

技术实现思路

1、有鉴于此，为了克服上述问题的至少一个方面，本专利技术实施例提出一种目标检测方法，包括以下步骤：

2、基于输入图像的特征图得到多个维度的第一图像特征图；

3、将多个维度的所述第一图像特征图分别进行编码并拼接得到第二图像特征图；

4、基于所述第二图像特征图得到第一权重和第二权重；

5、利用所述第一权重和所述第二权重对所述输入图像的特征图进行计算得到第三图像特征图，基于第三图像特征图进行目标检测。

6、在一些实施例中，基于输入图像的特征图得到多个维度的第一图像特征图，进一步包括：

7、将输入图像的特征图分别按照通道、宽度、高度进行展开并拼接得到对应的第一特征图、第二特征图、第三特征图。

8、在一些实施例中，将多个维度的所述第一图像特征图分别进行编码并拼接得到第二图像特征图，进一步包括：

9、将所述第一特征图、第二特征图、第三特征图分别进行编码得到第一编码特征图、第二编码特征图、第三编码特征图，并拼接所述第一编码特征图、所述第二编码特征图、所述第三编码特征图得到第二图像特征图。

10、在一些实施例中，将所述第一特征图、第二特征图、第三特征图分别进行编码，进一步还包括：

11、分别对所述第一特征图、所述第二特征图、所述第三特征图进行压缩得到第一压缩特征图、第二压缩特征图、第三压缩特征图并用预设维度的向量表示所述第一压缩特征图、所述第二压缩特征图、所述第三压缩特征图中的每一个点；

12、将所述第一压缩特征图、所述第二压缩特征图、所述第三压缩特征图分别融合位置编码信息，并输入到多头注意力模块进行计算。

13、在一些实施例中，将所述第一压缩特征图、所述第二压缩特征图、所述第三压缩特征图分别融合位置编码信息，进一步包括：

14、分别计算所述第一压缩特征图、所述第二压缩特征图、所述第三压缩特征图中每一个点对应的位置编码向量；

15、将所述第一压缩特征图、所述第二压缩特征图、所述第三压缩特征图中每一个点对应的向量分别与对应的位置编码向量相加。

16、在一些实施例中，基于所述第二图像特征图得到第一权重和第二权重，进一步包括：

17、对所述第二图像特征图进行空间维度的全局最大池化得到池化特征图；

18、利用第一多层感知机对空间维度的所述池化特征图进行计算并将计算结果进行归一化处理以得到第一权重；

19、对所述第二图像特征图进行通道维度的全局最大池化得到池化特征图；

20、利用第二多层感知机对通道维度的所述池化特征图进行计算并将计算结果进行归一化处理以得到第二权重。

21、在一些实施例中，基于目标特征图进行目标检测，进一步包括：

22、判断目标检测结果的准确率是否达到阈值；

23、相应于所述准确率未达到阈值，对所述多头注意力模块、所述第一多层感知机和所述第二多层感知机进行训练以调整所述第一权重和所述第二权重。

24、基于同一专利技术构思，根据本专利技术的另一个方面，本专利技术的实施例还提供了一种目标检测系统，包括：

25、第一计算模块，配置为基于输入图像的特征图得到多个维度的特征图；

26、编码模块，配置为将多个维度的所述特征图分别进行编码并进行拼接得到拼接特征图；

27、权重模块，配置为基于所述拼接特征图得到第一权重和第二权重；

28、第二计算模块，配置为利用所述第一权重和所述第二权重对所述输入图像的特征图进行计算得到目标特征图，基于目标特征图进行目标检测。

29、基于同一专利技术构思，根据本专利技术的另一个方面，本专利技术的实施例还提供了一种计算机设备，包括：

30、至少一个处理器；以及

31、存储器，所述存储器存储有可在所述处理器上运行的计算机程序，所述处理器执行所述程序时执行如上所述的任一种目标检测方法的步骤。

32、基于同一专利技术构思，根据本专利技术的另一个方面，本专利技术的实施例还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时执行如上所述的任一种目标检测方法的步骤。

33、本专利技术具有以下有益技术效果之一：本专利技术提出的方案通过在多个维度进行图像语义特征提取，提高语义信息的丰富度，进而有利于提高目标检测准确率和召回率。

本文档来自技高网...

【技术保护点】

1.一种目标检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，基于输入图像的特征图得到多个维度的第一图像特征图，进一步包括：

3.如权利要求2所述的方法，其特征在于，将多个维度的所述第一图像特征图分别进行编码并拼接得到第二图像特征图，进一步包括：

4.如权利要求2所述的方法，其特征在于，将所述第一特征图、第二特征图、第三特征图分别进行编码，进一步还包括：

5.如权利要求4所述的方法，其特征在于，将所述第一压缩特征图、所述第二压缩特征图、所述第三压缩特征图分别融合位置编码信息，进一步包括：

6.如权利要求4所述的方法，其特征在于，基于所述第二图像特征图得到第一权重和第二权重，进一步包括：

7.如权利要求6所述的方法，其特征在于，基于目标特征图进行目标检测，进一步包括：

8.一种目标检测系统，其特征在于，包括：

9.一种计算机设备，包括：

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时执

...

【技术特征摘要】

1.一种目标检测方法，其特征在于，包括以下步骤：

2.如权利要求1所述的方法，其特征在于，基于输入图像的特征图得到多个维度的第一图像特征图，进一步包括：

3.如权利要求2所述的方法，其特征在于，将多个维度的所述第一图像特征图分别进行编码并拼接得到第二图像特征图，进一步包括：

4.如权利要求2所述的方法，其特征在于，将所述第一特征图、第二特征图、第三特征图分别进行编码，进一步还包括：

5.如权利要求4所述的方法，其特征在于，将所述第一压缩特征图、所述第二压缩特征图、所述...

【专利技术属性】
技术研发人员：王金波，贺浩，李山，刘亚辉，郭振华，
申请(专利权)人：天翼交通科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人