目标检测方法、存储介质法及电子设备技术

技术编号:35677447 阅读:18 留言:0更新日期:2022-11-23 14:16
本发明专利技术提供一种目标检测方法、存储介质法及电子设备,所述方法包括:数据预处理,以扩充样本数量;构造基于混合域的注意力模块,并将其嵌入骨干网络以筛选目标物体特征;构造特征增强模块,并将其嵌入到特征金字塔结构的横向连接通道中,以增强所提取到的特征信息;采用检测头处理提取出的特征图,以预测小物体的类别、包围框的中心坐标和宽高。本发明专利技术可以有效解决解决小物体原始特征少和深层卷积神经网络容易丢失特征信息的问题,有效解决小目标检测问题。测问题。测问题。

【技术实现步骤摘要】
目标检测方法、存储介质法及电子设备


[0001]本专利技术涉及图像处理
,特别是涉及目标检测


技术介绍

[0002]目标检测是计算机视觉的基本任务之一。近年来,随着深度学习算法研究的不断深入和硬件资源的更新换代,许多高性能的目标检测器得以诞生。当前流行的目标检测算法一般可分为两种类型,一种是基于候选区域的两阶段检测算法,另一种是基于回归的单阶段检测算法。其中,两阶段检测算法在检测精度上取得了比较优秀的结果,而单阶段检测算法则在检测速度上更占据优势。两类目标检测算法均能对大型或中型物体进行相对准确的检测,但在识别小物体方面仍存在较大的缺陷。
[0003]造成该问题的原因主要有两点:其一,小型物体的分辨率往往很小,无法给予检测模型足够的特征信息,这使得现有算法很容易将目标与背景和噪声混淆;其二,当前最先进的方法都是基于深度卷积网络实现的,尽管更深的网络层所提取的特征具有更充分的感受野和更丰富的高层次语义信息,但物体经过多次下采样会丢失大量特征。
[0004]针对上述问题,现阶段有一些主流的检测算法通过引入注意力机制来帮助网络学会重点关注小物体的特征,其多采用全局平均池化或者全局最大池化来提取聚合特征,并借助全连接层或卷积层等运算将特征映射到更高级的维度。另一些检测算法在骨干网络和检测头之间引入金字塔结构,以重复利用小物体的特征信息。但在实际应用中,前述整合空间和通道特征的方式比较粗糙,难以更精确地挖掘特征图元素的内在关系,因此,小目标检测算法仍有待进一步的研究改进。

技术实现思路
<br/>[0005]鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种目标检测方法、存储介质法及电子设备,用于解决小物体原始特征少和深层卷积神经网络容易丢失特征信息等问题。
[0006]为实现上述目的及其他相关目的,本专利技术提供一种目标检测方法,所述方法包括:数据预处理,以扩充样本数量;构造基于混合域的注意力模块,并将其嵌入骨干网络,以筛选目标物体特征;构造特征增强模块,并将其嵌入到特征金字塔结构的横向连接通道中,以增强所提取到的特征信息;采用检测头处理提取出的特征图,以预测小物体的类别、包围框的中心坐标和宽高。
[0007]于本专利技术的一实施例中,所述数据预处理包括:对目标图像进行平移变换、水平翻转、颜色变换以及进行增强扩充图片数量。
[0008]于本专利技术的一实施例中,所述基于混合域的注意力包括基于批标准化的通道注意力和基于层标准化的空间注意力。
[0009]于本专利技术的一实施例中,所述预测小物体的类别、包围框的中心坐标和宽高的方式为:将所述特征图映射为包含物体类别、包围框中心坐标和宽高的向量并输出。
[0010]于本专利技术的一实施例中,所述增强模块由四个池化核组成,其中一个池化核为固定尺寸,其他三个池化核的宽高可变。
[0011]于本专利技术的一实施例中,实现所述池化核的宽高可变的方式为:对数据集进行k

means 聚类,得到多个锚框和多个检测头;将所述锚框乘以下采样率得到初始的池化核尺寸;将所述初始的池化核尺寸向上取整为奇数,得到池化核的宽和高的集合;获取每个集合占据面积最大的前三个集合作为所述增强模块中的三个池化核。
[0012]于本专利技术的一实施例中,所述特征增强模块生成四个独立的信息传输路径,并产生四个输出向量,并为所述四个输出向量配置可训练系数。
[0013]为实现上述目的及其他相关目的,本专利技术还提供一种存储介质,存储有程序指令,所述程序指令被执行时实现如上所述的目标检测方法的步骤。
[0014]为实现上述目的及其他相关目的,本专利技术还提供一种电子设备,包括存储器,用于存储计算机程序;处理器,用于运行所述计算机程序以实现如上所述的目标检测方法的步骤。
[0015]为实现上述目的及其他相关目的,本专利技术还提供一种移动机器人,应用如上所述的电子设备。
[0016]如上所述,本专利技术的目标检测方法、存储介质法及电子设备具有以下有益效果:
[0017]本专利技术可以有效解决解决小物体原始特征少和深层卷积神经网络容易丢失特征信息的问题,有效解决小目标检测问题。
附图说明
[0018]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1显示为本申请一实施例中的目标检测方法的整体流程示意图;
[0020]图2显示为本申请一实施例中的目标检测方法的检测过程示意图;
[0021]图3显示为本申请一实施例中的目标检测方法中基于批标准化的通道注意力流程示意图;
[0022]图4显示为本申请一实施例中的目标检测方法中基于层标准化的空间注意力流程示意图;
[0023]图5显示为本申请一实施例中的目标检测方法中增强模块的基本结构图;
[0024]图6显示为本申请一实施例中的目标检测方法中池化核尺寸设计示意图;
[0025]图7显示为本申请一实施例中的目标检测方法中自适应输出融合示意图;
[0026]图8显示为本申请一实施例中的电子设备的原理框图。
[0027]元件标号说明
[0028]101
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
电子设备
[0029]1001
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
处理器
[0030]1002
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
存储器
[0031]S100~S300
ꢀꢀꢀꢀꢀ
步骤
具体实施方式
[0032]以下通过特定的具体实例说明本专利技术的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本专利技术的其他优点与功效。本专利技术还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本专利技术的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。
[0033]本实施例的目的在于提供一种目标检测方法、存储介质法及电子设备,用于解决小物体原始特征少和深层卷积神经网络容易丢失特征信息等问题。
[0034]本实施例的目的在于创造性地提出了一种新型的小目标检测算法,以克服现有技术的不足。考虑到现有注意力机制多采用全局平均池化或全局最大池化聚合特征,本实施例首先设计了基于批标准化的通道注意力和基于层标准化的空间注意力,从数据分布的角度实现更精细的注意力机制,然后提出了一种特征增强模块,具体地,根据分而治之的设计思想设计了所述增强模块的基础结构,又根据小目标的尺寸特征完善模块中池化核的尺寸设置,再设计自适应的输出融合策略来整合所述增强模块多个分支的输出;最后使用检测头将提取到的特征映射为输出向量,得到图像中小目标的类别概率、包围框的中心坐标和宽高。
[0035]以下将详细本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于:所述方法包括:数据预处理,以扩充样本数量;构造基于混合域的注意力模块,并将其嵌入骨干网络,以筛选目标物体特征;构造特征增强模块,并将其嵌入到特征金字塔结构的横向连接通道中,以增强所提取到的特征信息;采用检测头处理提取出的特征图,以预测小物体的类别、包围框的中心坐标和宽高。2.根据权利要求1所述的目标检测方法,其特征在于:所述数据预处理包括:对目标图像进行平移变换、水平翻转、颜色变换以及进行增强扩充图片数量。3.根据权利要求1所述的目标检测方法,其特征在于:所述基于混合域的注意力包括基于批标准化的通道注意力和基于层标准化的空间注意力。4.根据权利要求1所述的目标检测方法,其特征在于:所述预测小物体的类别、包围框的中心坐标和宽高的方式为:将所述特征图映射为包含物体类别、包围框中心坐标和宽高的向量并输出。5.根据权利要求1所述的目标检测方法,其特征在于:所述增强模块由四个池化核组成,其中一个池化...

【专利技术属性】
技术研发人员:王若谷李柠
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1