一种基于梯度平均的长尾目标检测方法技术

技术编号:28625153 阅读:23 留言:0更新日期:2021-05-28 16:21
本发明专利技术公开了一种基于梯度平均的长尾目标检测方法,包括以下步骤:S1、获取图像数据集,并对图像数据集进行图像增强处理;S2、采用预训练模型在所述训练集上训练,得到初始目标检测模型;S3、对初始模型进行训练,得到最终目标检测模型;S4、将待目标检测的图片输入至所述最终目标检测模型,得到所述图片的正常类别以及长尾类别的识别结果,完成长尾目标检测。本发明专利技术能显著提升各种框架的尾部类别识别准确率。

【技术实现步骤摘要】
一种基于梯度平均的长尾目标检测方法
本专利技术涉及机器学习
,具体涉及一种基于梯度平均的长尾目标检测方法。
技术介绍
近年来,由于深度学习和卷积神经网络(CNN)的出现,计算机视觉界见证了物体识别的巨大成功。目标识别是计算机视觉中的一项基本任务,在重新识别、人体姿态估计和目标跟踪等相关任务中起着核心作用。如今,大多数用于通用对象识别的数据集,如PascalVOC和COCO,主要收集常见的类别,每个类都有大量的注释。然而,当涉及到更实际的场景时,不可避免地会出现类别频率长尾分布的大型词汇表数据集(例如LVIS)。类别的长尾分布问题对目标检测模型的学习是一个很大的挑战,特别是对于样本很少的类别。对于一个类别,其他类别包括背景的所有样本都被视为负样本。因此,在训练过程中,少数类别容易被大多数类别(样本数量大的类别)所压倒,并倾向于被预测为否定的类别。因此,在这样一个极不平衡的数据集上训练的传统的物体探测器会大大下降。
技术实现思路
针对现有技术的不足,本专利技术的目的旨在提供一种基于梯度平均的长尾目标检测方法。为实现上述目的,本专利技术采用如下技术方案:一种基于梯度平均的长尾目标检测方法,包括以下步骤:S1:获取符合长尾分布的图像数据集,并对所述图像数据集进行图像增强处理,得到图像增强数据集,将所述图像增强数据集划分为训练集和测试集;S2:采用预训练模型在所述训练集上训练,得到初始目标检测模型;S3:用所述初始目标检测模型在训练集上进行初步检测得到初步检测结果,根据初步检测结果的表征在初始目标检测模型中定义出类别分类器,根据类别分类器的正梯度和负梯度的累计梯度比对类别分类器进行加权,同时在类别分类器上增加一个检测客观性的分支,得到新初始目标检测模型,将所述新初始目标检测模型在训练集上进行训练,得到最终目标检测模型;S4:将待目标检测的图片输入至所述最终目标检测模型,得到所述图片的正常类别以及长尾类别的识别结果,完成长尾目标检测。进一步地,所述数据集为LVIS数据集。进一步地,所述步骤S1还包括:对所述训练集的图片进行旋转,产生四张不同角度的子图片,再用尺寸变换和二值分割的方法对所述子图片进行图像增强处理。进一步地,所述步骤S2还包括:采用FasterR-CNN作为原始目标检测模型,原始目标检测模型中的主干卷积网络在ImageNet上进行预训练,得到所述预训练模型,所述预训练模型为Inception-Resnet-V2。进一步地,所述Inception-Resnet-V2模型包括stem结构、Inception-resnet-A结构、Inception-resnet-B结构和Inception-resnet-C结构。进一步地,所述步骤S2还包括:对所述预训练模型进行微调,将所述预训练模型的权重衰减设为0.0001,批处理大小为16,使用动量为0.9的SGD优化器训练30轮,前20轮学习率设为1e-4,后面10轮由1e-5递减为1e-6,采用微调后的预训练模型在训练集上进行训练,得到所述初始目标检测模型。进一步地,所述步骤3还包括:所述类别分类器的输出zj相对于损失梯度L的正梯度的计算公式为:其中,是第i个实例的one-hot编码,是第i个情况下第j类的估计概率。进一步地,所述步骤3还包括:所述类别分类器的输出zj相对于损失梯度L的负梯度的计算公式为:其中,是第i个实例的one-hot编码,是第i个情况下第j类的估计概率。进一步地,所述步骤3还包括:定义为所述类别分类器正梯度和负梯度的比值,迭代t次,迭代过程中正负梯度权重计算如下:其中,f()是映射函数:本专利技术的有益效果在于:本专利技术创造的梯度平均缓解长尾目标检测数据分布的方法与传统方法的区别:传统方法一般采用解耦训练,但是它们需要一个额外的微调阶段,并且表示和分类器的脱节优化可能导致次优结果。本专利技术采用端到端的训练方法,在训练阶段动态平衡正负样本的梯度比例,能够显著提升各种框架的尾部类别识别准确率。附图说明附图1为本专利技术流程图;附图2为本专利技术预训练模型网络结构图。具体实施方式下面,结合附图以及具体实施方式,对本专利技术做进一步描述:本专利技术提供了一种基于梯度平均的长尾目标检测方法,引入一种均衡损失策略,通过梯度引导Re-weighing机制,目标检测模型可以独立且均等地重新平衡每个类别的训练过程,大大提高长尾目标检测的准确性。一种基于梯度平均的长尾目标检测方法,包括以下步骤:S1:获取符合长尾分布的图像数据集,并对图像数据集进行图像增强处理,得到图像增强数据集,将图像增强数据集划分为训练集和测试集;S2:采用预训练模型在训练集上训练,得到初始目标检测模型;S3:用初始目标检测模型在训练集上进行初步检测得到初步检测结果,根据初步检测结果的表征在初始目标检测模型中定义出类别分类器,根据类别分类器的正梯度和负梯度的累计梯度比对类别分类器进行加权,同时在类别分类器上增加一个检测客观性的分支,得到新初始目标检测模型,将新初始目标检测模型在训练集上进行训练,得到最终目标检测模型;S4:将待目标检测的图片输入至最终模型,得到图片的正常类别以及长尾类别的识别结果,完成长尾目标检测。进一步地,数据集为LVIS数据集。步骤S1还包括:对训练集的图片进行旋转,产生四张不同角度的子图片,再用尺寸变换和二值分割的方法对子图片进行图像增强处理。训练数据采用LVIS数据集,提供精确地边框标注和类别标签,且其数据特征符合长尾分布。为了防止过拟合,再对训练集通过采取角度不同的旋转产生四张子图片,还进行尺寸变换和分割等方法进行加倍。原来一张训练图记为分成的四张旋转后的子图片记为尺寸变换后的子图片记为采取逐像素的二值分割后的图片记为字符计数值为C。进一步地,步骤S2还包括:采用FasterR-CNN作为原始目标检测模型,原始目标检测模型中的主干卷积网络在ImageNet上进行预训练,得到预训练模型,该预训练模型为Inception-Resnet-V2。预训练模型Inception-Resnet-V2模型如图2所示,包括四个重要的部分:stem、Inception-resnet-A、Inception-resnet-B和Inception-resnet-C。Stem部分输入后进行三次3x3的32维卷积,最大池化后再经过一个1x1的80维卷积、一个3x3的192维卷积和最大池化,再通过四个分支进行堆叠;Inception-resnet-A结构分为四个分支,第一个分支未经处理直接输出;第二个分支经过一次1x1的32通道卷积,第三个分支经过一次1x1的32通道的卷积处理和一次3x3的32通道的卷积处理;第四个分支经过一次1x1的32通道的卷积处理、一次3x3的48通道和一次3x3的64通道卷本文档来自技高网...

【技术保护点】
1.一种基于梯度平均的长尾目标检测方法,其特征在于,包括以下步骤:/nS1:获取符合长尾分布的图像数据集,并对所述图像数据集进行图像增强处理,得到图像增强数据集,将所述图像增强数据集划分为训练集和测试集;/nS2:采用预训练模型在所述训练集上训练,得到初始目标检测模型;/nS3:用所述初始目标检测模型在训练集上进行初步检测得到初步检测结果,根据初步检测结果的表征在初始目标检测模型中定义出类别分类器,根据类别分类器的正梯度和负梯度的累计梯度比对类别分类器进行加权,同时在类别分类器上增加一个检测客观性的分支,得到新初始目标检测模型,将所述新初始目标检测模型在训练集上进行训练,得到最终目标检测模型;/nS4:将待目标检测的图片输入至所述最终目标检测模型,得到所述图片的正常类别以及长尾类别的识别结果,完成长尾目标检测。/n

【技术特征摘要】
1.一种基于梯度平均的长尾目标检测方法,其特征在于,包括以下步骤:
S1:获取符合长尾分布的图像数据集,并对所述图像数据集进行图像增强处理,得到图像增强数据集,将所述图像增强数据集划分为训练集和测试集;
S2:采用预训练模型在所述训练集上训练,得到初始目标检测模型;
S3:用所述初始目标检测模型在训练集上进行初步检测得到初步检测结果,根据初步检测结果的表征在初始目标检测模型中定义出类别分类器,根据类别分类器的正梯度和负梯度的累计梯度比对类别分类器进行加权,同时在类别分类器上增加一个检测客观性的分支,得到新初始目标检测模型,将所述新初始目标检测模型在训练集上进行训练,得到最终目标检测模型;
S4:将待目标检测的图片输入至所述最终目标检测模型,得到所述图片的正常类别以及长尾类别的识别结果,完成长尾目标检测。


2.根据权利要求1所述一种基于梯度平均的长尾目标检测方法,其特征在于,所述数据集为LVIS数据集。


3.根据权利要求1所述一种基于梯度平均的长尾目标检测方法,其特征在于,所述步骤S1还包括:对所述训练集的图片进行旋转,产生四张不同角度的子图片,再用尺寸变换和二值分割的方法对所述子图片进行图像增强处理。


4.根据权利要求1所述一种基于梯度平均的长尾目标检测方法,其特征在于,所述步骤S2还包括:采用FasterR-CNN作为原始目标检测模型,原始目标检测模型中的主干卷积网络在ImageNet上进行预训练,得到所述预训练模型,所述预训练模型为Inception-Resnet-V2模型。


5.根据权利要求4所述一种基于梯度平均的长尾目标检测方...

【专利技术属性】
技术研发人员:杨航杨海东黄坤山
申请(专利权)人:佛山市南海区广工大数控装备协同创新研究院佛山市广工大数控装备技术发展有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1