目标检测方法、系统及存储介质技术方案

技术编号:33211913 阅读:16 留言:0更新日期:2022-04-27 16:47
本申请提供了一种目标检测方法、系统及计算机介质,具体的,通过图像采集获取目标检测数据集,对目标检测数据集进行图像预处理,得到增强目标检测数据集;增强目标检测数据集包括标注的真实标签;将增强目标检测数据集输入小目标检测网络,得到预测标签;构建损失函数使预测标签与真实标签之间的损失值达到最小值,进而训练小目标检测网络,得到训练后的小目标检测网络;将待检测图像输入训练后的小目标检测网络,得到目标分类以及目标定位结果。本申请通过增强小目标检测数据集,实现了对小目标物体的有效检测及分类;实现了对小目标物体检测准确定位、准确分类以及缩短检测时间的效果。效果。效果。

【技术实现步骤摘要】
目标检测方法、系统及存储介质


[0001]本申请属于人工智能
,具体地,涉及一种目标检测方法、系统及存储介质。

技术介绍

[0002]目前,随着人工智能技术的快速发展,神经网络(例如,深度神经网络)近年来在图像、视频以及语音等多种媒体信号的处理与分析中取得了很大的成就。一个性能优良的神经网络往往拥有精妙的网络结构,而这需要具有高超技能和丰富经验的人类专家花费大量精力进行构建。为了更好地构建神经网络,人们提出了通过神经网络结构搜索(neuralarchitecturesearch,NAS)的方法来搭建神经网络,通过自动化地搜索神经网络结构,从而得到性能优异的神经网络结构。
[0003]目标检测技术是计算机视觉技术的基础,目标检测技术可以检测出图像中包含的诸如人像、动物或物品等多种目标对象。在实际应用中目标检测技术可应用于诸多场景目标检测一般是在图像中定位目标物体并赋予目标物体相应的标签。
[0004]当前目标检测数据集通常使用Microsoft COCO(Microsoft Common Object in Context)等大型数据集,Microsoft COCO数据集是微软与2014年出资标注的数据集。其包含了20万个图像,80个类别中超过50万个目标标注,平均每个图像的目标数为7.2个,标注的物体尺寸通常较大,小尺寸标注物体较少。目前Microsoft COCO数据集有3种标注类型:目标检测、目标关键点检测和看图说话,以json文件形式存储。使用Microsoft COCO等大型数据集,其物体通常比较大,小目标物体较少;且缺乏有效的数据分析及增强方法。
[0005]因此,目前的目标检测算法通常具有对小目标物体检测定位不准确、分类错误以及检测耗时较长的问题。

技术实现思路

[0006]本专利技术提出了一种目标检测方法系统及存储介质,旨在解决目前的目标检测算法通常具有对小目标物体检测定位不准确、分类错误以及检测耗时较长的问题。
[0007]根据本申请实施例的第一个方面,提供了一种目标检测方法,具体包括以下步骤:
[0008]通过图像采集获取目标检测数据集,对目标检测数据集进行图像预处理,得到增强目标检测数据集;增强目标检测数据集包括标注的真实标签;
[0009]将增强目标检测数据集输入小目标检测网络,得到预测标签;构建损失函数使预测标签与真实标签之间的损失值达到最小值,进而训练小目标检测网络,得到训练后的小目标检测网络;
[0010]将待检测图像输入训练后的小目标检测网络,得到目标分类以及目标定位结果。
[0011]在本申请一些实施方式中,通过图像采集获取目标检测数据集,对目标检测数据集进行图像预处理,得到增强目标检测数据集中,图像预处理包括通过数据增强算法和/或网络参数增强算法增强目标检测数据集,数据增强算法包括:
[0012]通过随机旋转、多尺度裁剪以及均匀切分依次对目标检测数据集中的源图像进行变换和切分,得到切分后的目标检测数据集;
[0013]将切分后的目标检测数据集进行归一化处理,得到归一化目标检测数据集;
[0014]将归一化目标检测数据集的图像进行尺寸缩放、旋转增强和/或亮度对比度调整,得到增强目标检测数据集。
[0015]在本申请一些实施方式中,将切分后的目标检测数据集进行归一化处理,得到归一化目标检测数据集,归一化公式为:
[0016][0017]其中,x表示输入数据,x
*
表示归一化后的输出数据。
[0018]在本申请一些实施方式中,将归一化目标检测数据集的图像进行尺寸缩放、旋转增强和/或亮度对比度调整,得到增强目标检测数据集,具体包括:
[0019]尺寸缩放的公式为:
[0020][0021]其中,f
x
和f
y
分别表示x轴和y轴的缩放因子;x和y分别表示缩放前输入图像的宽和高;x

和y

表示缩放后输出图像的宽和高;
[0022]旋转增强的公式为:
[0023][0024]其中,θ是旋转的角度;x和y分别表示缩放前输入图像的宽和高,x

和y

表示缩放后的宽和高;x

和y

表示缩放后输出图像的宽和高;
[0025]亮度对比度调整的公式为:
[0026]Out=Average+(In

Average)*(1+percent);
[0027]其中,In表示原始像素点亮度;Average表示整张图片的平均亮度;Out表示调整后的亮度;percent∈[

1,1]表示调整范围。
[0028]在本申请一些实施方式中,将增强目标检测数据集输入小目标检测网络,得到预测标签之前,还包括构建小目标检测网络;小目标检测网络采用目标检测网络作为小目标检测网络的框架,并使用Swin Transformer Tiny网络作为小目标检测网络的复合主干网络。
[0029]在本申请一些实施方式中,将增强目标检测数据集输入小目标检测网络,得到预测标签之前,还包括构建小目标检测网络;小目标检测网络采用复合主干网络,复合主干网络由一个编码块PE和多个阶段组成,一个阶段包括一个融合块PM和多个转化块TB组成;
[0030]其中,编码块PE、融合块PM以及转化块TB的表示公式如下:
[0031]PE(x,ksize,outchannel)=LayerNorm(Conv2D(x,inchannel,outchannel,ksize,ksize));
[0032]PM(f)=Linear(LayerNorm(Downsample(f,2)),inchannel,outchannel);
[0033]其中Conv2D(x,inchannel,outchannel,ksize,ksize)表示2D卷积操作;x表示多尺度小目标数据集输入,inchannel表示输入通道数;outchannel表示输出通道数;ksize表示卷积尺寸大小;Conv2D表示2D卷积;LayerNorm(x)表示归一化层;Downsample(f,2)表示对特征f进行步长为2的下采样,Linear(x,inchannel,outputchannel)表示全连接层;
[0034]TB(f)=SWMSABlock(WMSABlock(f));
[0035]其中,SWMSABlock(f)=MLP(LayerNorm(G
SWMSA
(f)))+G
SWMSA
(f);
[0036]WMSABlock(f)=MLP(LayerNorm(G
WMSA
(f)))+G
WMSA
(f);
[0037]G
WMSA
(f)=WMSA((LayerNorm(f)))+f本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括以下步骤:通过图像采集获取目标检测数据集,对所述目标检测数据集进行图像预处理,得到增强目标检测数据集;所述增强目标检测数据集包括标注的真实标签;将所述增强目标检测数据集输入小目标检测网络,得到预测标签;构建损失函数使所述预测标签与真实标签之间的损失值达到最小值,进而训练所述小目标检测网络,得到训练后的小目标检测网络;将待检测图像输入所述训练后的小目标检测网络,得到目标分类以及目标定位结果。2.根据权利要求1所述的目标检测方法,其特征在于,所述图像预处理包括通过数据增强算法和/或网络参数增强算法增强所述目标检测数据集,所述数据增强算法包括:通过随机旋转、多尺度裁剪以及均匀切分依次对所述目标检测数据集中的源图像进行变换和切分,得到切分后的目标检测数据集;将所述切分后的目标检测数据集进行归一化处理,得到归一化目标检测数据集;将所述归一化目标检测数据集的图像进行尺寸缩放、旋转增强和/或亮度对比度调整,得到增强目标检测数据集。3.根据权利要求2所述的目标检测方法,其特征在于,所述归一化处理的公式为:其中,x表示输入数据,x
*
表示归一化后的输出数据。4.根据权利要求2所述的目标检测方法,其特征在于,所述尺寸缩放的公式为:其中,f
x
和f
y
分别表示x轴和y轴的缩放因子;x和y分别表示缩放前输入图像的宽和高;x

和y

表示缩放后输出图像的宽和高;所述旋转增强的公式为:其中,θ是旋转的角度;x和y分别表示缩放前输入图像的宽和高,x

和y

表示缩放后输出图像的宽和高;所述亮度对比度调整的公式为:Out=Average+(In

Average)*(1+percent);其中,In表示原始像素点亮度;Average表示整张图片的平均亮度;Out表示调整后的亮度;percent∈[

1,1]表示调整范围。5.根据权利要求1所述的目标检测方法,其特...

【专利技术属性】
技术研发人员:刘斌徐博诚郑轩刘跃
申请(专利权)人:特斯联科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1