基于主动学习的目标检测模型训练方法技术

技术编号:29586743 阅读:30 留言:0更新日期:2021-08-06 19:46
本发明专利技术提供了一种基于主动学习的目标检测模型训练方法,包括:由专家标定输入数据集向模型训练数据集输入标记有专家标签的样本图像,和/或由无标定输入数据集向模型训练数据集输入无目标对象框选的样本图像;当模型训练数据集的样本图像数量值小于或等于数据上限值时,继续训练初始模型,当样本图像数量值大于数据上限值时,选取筛除图像后训练初始模型,在筛除图像中选取无专家标签的输入待标定困难样本数据集;对其中的筛除图像进行目标对象框选筛查及专家标签标记后输入专家标定输入数据集,重复上述方案,生成目标检测模型。本发明专利技术解决了现有技术中的为了提升目标检测模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。

【技术实现步骤摘要】
基于主动学习的目标检测模型训练方法
本专利技术涉及图像处理
,具体而言,涉及一种基于主动学习的目标检测模型训练方法。
技术介绍
目标检测是一种基于目标几何和统计特征的图像理解算法,目标检测是将目标对象的定位和识别合二为一,例如:基于计算机视觉算法,检测出图像中不同类别的目标对象,即以矩形框标注出目标的位置,并识别出目标对象的类别。为了能够使目标检测模型适合应用于不同的环境场景,提升目标检测模型的泛化能力,在对目标检测模型训练的过程中通常不断地优化调整模型参数,达到模型精修的目的;这就需要向用于目标检测模型训练的模型训练数据集内阶段性地输入来自于不同环境场景的样本图像,而模型训练数据集的数据量不断累积会导致模型训练难度提升、训练耗时严重,不利于目标检测模型的优化训练。因此,如何提供一种能够提升目标检测模型的泛化能力,同时兼顾提高了模型训练效率的目标检测模型训练方法便成了现有技术中亟待解决的问题。
技术实现思路
本专利技术的主要目的在于提供一种基于主动学习的目标检测模型训练方法,以解决现有技术中的目标检测模型训练过程中,为了提升模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。为了实现上述目的,本专利技术提供了一种基于主动学习的目标检测模型训练方法,包括:步骤S1,构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ),构造模型训练数据集(Ⅰ)用于训练初始模型,通过第一输送通道由专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像,和/或通过第二输送通道由无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像;步骤S2,获取模型训练数据集(Ⅰ)中样本图像数量值,并与模型训练数据集(Ⅰ)预先设定的数据上限值比较,当其中的样本图像数量值小于或等于数据上限值时,利用模型训练数据集(Ⅰ)继续训练初始模型,当其中的样本图像数量值大于数据上限值时,执行下述步骤S3;步骤S3,根据选取条件在模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像,将筛除图像取出模型训练数据集(Ⅰ)后利用模型训练数据集(Ⅰ)训练初始模型,并在筛除图像中选取至少一部分无专家标签的筛除图像归类输入待标定困难样本数据集(Ⅳ);步骤S4,对归类输入待标定困难样本数据集(Ⅳ)中的筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ),重复步骤S1至步骤S4,直至对初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。进一步地,步骤S3包括:步骤S31,根据初始模型对模型训练数据集(Ⅰ)中的至少一部分样本图像进行损失值的计算,并将至少一部分样本图像按照各自对应的损失值降序排列,以构造损失值图像序列;步骤S32,由损失值图像序列的损失值高端开始遍历损失值图像序列并顺次选取n1个无专家标签的样本图像作为用于输入待标定困难样本数据集(Ⅳ)的困难数据样本,由损失值图像序列的损失值低端开始遍历损失值图像序列并顺次选取n2个样本图像作为简单数据样本,其中,困难数据样本的数量n1和简单数据样本n2之和等于筛除图像的数量X。进一步地,步骤S3还包括:步骤S33,对简单数据样本中的样本图像逐一判定,当其中的样本图像标记有专家标签时,归类输入专家标定简单数据集(Ⅴ),当其中的样本图像无专家标签时,归类输入常规简单数据集(Ⅵ)。进一步地,在步骤S32中,困难数据样本的用于输入待标定困难样本数据集(Ⅳ)n1个无专家标签的样本图像的损失值高于第一预设筛选范围值,第一预设筛选范围值大于等于1.2且小于等于1.6;在步骤S33中,简单数据样本中的归类输入专家标定简单数据集(Ⅴ)的样本图像的损失值低于第二预设筛选范围值时,第二预设筛选范围值大于等于0.3且小于等于0.5。进一步地,困难数据样本的数量n1和简单数据样本n2满足:1/9≦n1/n2≦1/5。进一步地,在步骤S31中,根据初始模型对模型训练数据集(Ⅰ)中的去除掉来自专家标定输入数据集(Ⅱ)的输入部分和/或去除掉来自无标定输入数据集(Ⅲ)的输入部分后的剩余部分的样本图像进行损失值的计算,并将剩余部分的样本图像按照各自对应的损失值降序排列,以构造损失值图像序列。进一步地,在步骤S4中,目标对象框选筛查及专家标签标记包括:当筛除图像中框选了正确的目标对象时,对筛除图像标记专家标签;当筛除图像中未框选正确的目标对象时,对筛除图像的框选修订后标记专家标签。进一步地,标记专家标签为在筛除图像的文件格式命名中添加识别字符,以表示其中框选正确的目标对象。进一步地,数据上限值大于等于10万且小于等于100万;预设训练轮数大于等于100万且小于等于900万;预设要求为当初始模型的召回率和精度值均大于等于0.9且小于等于1。进一步地,专家标定输入数据集(Ⅱ)中的样本图像来源还包括新输入的且标记了专家标签的样本图像;无标定输入数据集(Ⅲ)中的样本图像来源为新输入的无专家标签的样本图像。应用本专利技术的技术方案,通过主动学习这种半监督学习方式,不仅允许专家标定输入数据集(Ⅱ)向模型训练数据集(Ⅰ)输入标记有专家标签的样本图像和/或无标定输入数据集(Ⅲ)向模型训练数据集(Ⅰ)输入无目标对象框选的样本图像,以满足模型训练数据集(Ⅰ)内样本图像的多样性,有利于训练好的目标检测模型适用于不同的环境场景,而且能够同时实现对模型训练数据集(Ⅰ)中样本图像数量的精准化自动调控,确保目标检测模型训的训练稳定性;当模型训练数据集(Ⅰ)中的样本数量超过数据上限值时,超出的部分作为筛除图像,且可能存在错误标注信息的无专家标签的筛除图像被归类输入待标定困难样本数据集(Ⅳ),进一步接受认为更正,即对待标定困难样本数据集(Ⅳ)中的筛除图像进行目标对象框选筛查及专家标签标记后作为样本图像输入专家标定输入数据集(Ⅱ),以循环使用,这个过程避免了模型训练数据集(Ⅰ)中样本图像的数量累计过大,确保了训练目标检测模型过程的高效性和稳定性。附图说明构成本申请的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1示出了根据本专利技术的一种可选实施例的基于主动学习的目标检测模型训练方法的流程图;图2示出了根据本专利技术的一种可选实施例的基于主动学习的目标检测模型训练方法中对数据集处理的流程示意图。其中,上述附图包括以下附图标记:Ⅰ、模型训练数据集;Ⅱ、专家标定输入数据集;Ⅲ、无标定输入数据集;Ⅳ、待标定困难样本数据集;Ⅴ、专家标定简单数据集;Ⅵ、常规简单数据集。具体实施方式需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本专利技术。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的本文档来自技高网
...

【技术保护点】
1.一种基于主动学习的目标检测模型训练方法,其特征在于,包括:/n步骤S1,构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ),所述构造模型训练数据集(Ⅰ)用于训练初始模型,通过第一输送通道由所述专家标定输入数据集(Ⅱ)向所述模型训练数据集(Ⅰ)输入标记有专家标签的样本图像,和/或通过第二输送通道由所述无标定输入数据集(Ⅲ)向所述模型训练数据集(Ⅰ)输入无目标对象框选的样本图像;/n步骤S2,获取所述模型训练数据集(Ⅰ)中样本图像数量值,并与所述模型训练数据集(Ⅰ)预先设定的数据上限值比较,当其中的样本图像数量值小于或等于所述数据上限值时,利用所述模型训练数据集(Ⅰ)继续训练所述初始模型,当其中的样本图像数量值大于数据上限值时,执行下述步骤S3;/n步骤S3,根据选取条件在所述模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像,将所述筛除图像取出所述模型训练数据集(Ⅰ)后利用所述模型训练数据集(Ⅰ)训练所述初始模型,并在所述筛除图像中选取至少一部分无专家标签的所述筛除图像归类输入待标定困难样本数据集(Ⅳ);/n步骤S4,对归类输入所述待标定困难样本数据集(Ⅳ)中的所述筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入所述专家标定输入数据集(Ⅱ),重复所述步骤S1至所述步骤S4,直至对所述初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。/n...

【技术特征摘要】
1.一种基于主动学习的目标检测模型训练方法,其特征在于,包括:
步骤S1,构造模型训练数据集(Ⅰ)、专家标定输入数据集(Ⅱ)和无标定输入数据集(Ⅲ),所述构造模型训练数据集(Ⅰ)用于训练初始模型,通过第一输送通道由所述专家标定输入数据集(Ⅱ)向所述模型训练数据集(Ⅰ)输入标记有专家标签的样本图像,和/或通过第二输送通道由所述无标定输入数据集(Ⅲ)向所述模型训练数据集(Ⅰ)输入无目标对象框选的样本图像;
步骤S2,获取所述模型训练数据集(Ⅰ)中样本图像数量值,并与所述模型训练数据集(Ⅰ)预先设定的数据上限值比较,当其中的样本图像数量值小于或等于所述数据上限值时,利用所述模型训练数据集(Ⅰ)继续训练所述初始模型,当其中的样本图像数量值大于数据上限值时,执行下述步骤S3;
步骤S3,根据选取条件在所述模型训练数据集(Ⅰ)中选取超出其数据上限值部分的数量的样本图像定义为筛除图像,将所述筛除图像取出所述模型训练数据集(Ⅰ)后利用所述模型训练数据集(Ⅰ)训练所述初始模型,并在所述筛除图像中选取至少一部分无专家标签的所述筛除图像归类输入待标定困难样本数据集(Ⅳ);
步骤S4,对归类输入所述待标定困难样本数据集(Ⅳ)中的所述筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入所述专家标定输入数据集(Ⅱ),重复所述步骤S1至所述步骤S4,直至对所述初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。


2.根据权利要求1所述的目标检测模型训练方法,其特征在于,所述步骤S3包括:
步骤S31,根据所述初始模型对所述模型训练数据集(Ⅰ)中的至少一部分样本图像进行损失值的计算,并将所述至少一部分样本图像按照各自对应的所述损失值降序排列,以构造损失值图像序列;
步骤S32,由所述损失值图像序列的损失值高端开始遍历所述损失值图像序列并顺次选取n1个无专家标签的样本图像作为用于输入所述待标定困难样本数据集(Ⅳ)的困难数据样本,由所述损失值图像序列的损失值低端开始遍历所述损失值图像序列并顺次选取n2个样本图像作为简单数据样本,其中,所述困难数据样本的数量n1和所述简单数据样本n2之和等于所述筛除图像的数量X。


3.根据权利要求2所述的目标检测模型训练方法,其特征在于,所述步骤S3还包括:
步骤S33,对所述简单数据样本中的样本图像逐一判定,当其中的样本图像标记有专家标签时,归类输...

【专利技术属性】
技术研发人员:陈映曹松任必为郑翔宋君陶海
申请(专利权)人:北京文安智能技术股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1