基于主动学习的目标检测模型训练方法技术

技术编号：29586743 阅读：30 留言：0更新日期：2021-08-06 19:46

本发明专利技术提供了一种基于主动学习的目标检测模型训练方法，包括：由专家标定输入数据集向模型训练数据集输入标记有专家标签的样本图像，和/或由无标定输入数据集向模型训练数据集输入无目标对象框选的样本图像；当模型训练数据集的样本图像数量值小于或等于数据上限值时，继续训练初始模型，当样本图像数量值大于数据上限值时，选取筛除图像后训练初始模型，在筛除图像中选取无专家标签的输入待标定困难样本数据集；对其中的筛除图像进行目标对象框选筛查及专家标签标记后输入专家标定输入数据集，重复上述方案，生成目标检测模型。本发明专利技术解决了现有技术中的为了提升目标检测模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。

全部详细技术资料下载

【技术实现步骤摘要】
基于主动学习的目标检测模型训练方法
本专利技术涉及图像处理
，具体而言，涉及一种基于主动学习的目标检测模型训练方法。
技术介绍
目标检测是一种基于目标几何和统计特征的图像理解算法，目标检测是将目标对象的定位和识别合二为一，例如：基于计算机视觉算法，检测出图像中不同类别的目标对象，即以矩形框标注出目标的位置，并识别出目标对象的类别。为了能够使目标检测模型适合应用于不同的环境场景，提升目标检测模型的泛化能力，在对目标检测模型训练的过程中通常不断地优化调整模型参数，达到模型精修的目的；这就需要向用于目标检测模型训练的模型训练数据集内阶段性地输入来自于不同环境场景的样本图像，而模型训练数据集的数据量不断累积会导致模型训练难度提升、训练耗时严重，不利于目标检测模型的优化训练。因此，如何提供一种能够提升目标检测模型的泛化能力，同时兼顾提高了模型训练效率的目标检测模型训练方法便成了现有技术中亟待解决的问题。
技术实现思路
本专利技术的主要目的在于提供一种基于主动学习的目标检测模型训练方法，以解决现有技术中的目标检测模型训练过程中，为了提升模型泛化能力而导致训练数据集的数据量累积造成模型训练效率低下的问题。为了实现上述目的，本专利技术提供了一种基于主动学习的目标检测模型训练方法，包括：步骤S1，构造模型训练数据集（Ⅰ）、专家标定输入数据集（Ⅱ）和无标定输入数据集（Ⅲ），构造模型训练数据集（Ⅰ）用于训练初始模型，通过第一输送通道由专家标定输入数据集（Ⅱ）向模型训练数据集（Ⅰ）输入标记有专家标签...

【技术保护点】
1.一种基于主动学习的目标检测模型训练方法，其特征在于，包括：/n步骤S1，构造模型训练数据集（Ⅰ）、专家标定输入数据集（Ⅱ）和无标定输入数据集（Ⅲ），所述构造模型训练数据集（Ⅰ）用于训练初始模型，通过第一输送通道由所述专家标定输入数据集（Ⅱ）向所述模型训练数据集（Ⅰ）输入标记有专家标签的样本图像，和/或通过第二输送通道由所述无标定输入数据集（Ⅲ）向所述模型训练数据集（Ⅰ）输入无目标对象框选的样本图像；/n步骤S2，获取所述模型训练数据集（Ⅰ）中样本图像数量值，并与所述模型训练数据集（Ⅰ）预先设定的数据上限值比较，当其中的样本图像数量值小于或等于所述数据上限值时，利用所述模型训练数据集（Ⅰ）继续训练所述初始模型，当其中的样本图像数量值大于数据上限值时，执行下述步骤S3；/n步骤S3，根据选取条件在所述模型训练数据集（Ⅰ）中选取超出其数据上限值部分的数量的样本图像定义为筛除图像，将所述筛除图像取出所述模型训练数据集（Ⅰ）后利用所述模型训练数据集（Ⅰ）训练所述初始模型，并在所述筛除图像中选取至少一部分无专家标签的所述筛除图像归类输入待标定困难样本数据集（Ⅳ）；/n步骤S4，对归类输入所述待...

【技术特征摘要】
1.一种基于主动学习的目标检测模型训练方法，其特征在于，包括：
步骤S1，构造模型训练数据集（Ⅰ）、专家标定输入数据集（Ⅱ）和无标定输入数据集（Ⅲ），所述构造模型训练数据集（Ⅰ）用于训练初始模型，通过第一输送通道由所述专家标定输入数据集（Ⅱ）向所述模型训练数据集（Ⅰ）输入标记有专家标签的样本图像，和/或通过第二输送通道由所述无标定输入数据集（Ⅲ）向所述模型训练数据集（Ⅰ）输入无目标对象框选的样本图像；
步骤S2，获取所述模型训练数据集（Ⅰ）中样本图像数量值，并与所述模型训练数据集（Ⅰ）预先设定的数据上限值比较，当其中的样本图像数量值小于或等于所述数据上限值时，利用所述模型训练数据集（Ⅰ）继续训练所述初始模型，当其中的样本图像数量值大于数据上限值时，执行下述步骤S3；
步骤S3，根据选取条件在所述模型训练数据集（Ⅰ）中选取超出其数据上限值部分的数量的样本图像定义为筛除图像，将所述筛除图像取出所述模型训练数据集（Ⅰ）后利用所述模型训练数据集（Ⅰ）训练所述初始模型，并在所述筛除图像中选取至少一部分无专家标签的所述筛除图像归类输入待标定困难样本数据集（Ⅳ）；
步骤S4，对归类输入所述待标定困难样本数据集（Ⅳ）中的所述筛除图像逐一进行目标对象框选筛查及专家标签标记后作为样本图像输入所述专家标定输入数据集（Ⅱ），重复所述步骤S1至所述步骤S4，直至对所述初始模型完成预设训练轮数的训练和/或达到预设要求后生成目标检测模型。

2.根据权利要求1所述的目标检测模型训练方法，其特征在于，所述步骤S3包括：
步骤S31，根据所述初始模型对所述模型训练数据集（Ⅰ）中的至少一部分样本图像进行损失值的计算，并将所述至少一部分样本图像按照各自对应的所述损失值降序排列，以构造损失值图像序列；
步骤S32，由所述损失值图像序列的损失值高端开始遍历所述损失值图像序列并顺次选取n1个无专家标签的样本图像作为用于输入所述待标定困难样本数据集（Ⅳ）的困难数据样本，由所述损失值图像序列的损失值低端开始遍历所述损失值图像序列并顺次选取n2个样本图像作为简单数据样本，其中，所述困难数据样本的数量n1和所述简单数据样本n2之和等于所述筛除图像的数量X。

3.根据权利要求2所述的目标检测模型训练方法，其特征在于，所述步骤S3还包括：
步骤S33，对所述简单数据样本中的样本图像逐一判定，当其中的样本图像标记有专家标签时，归类输...

【专利技术属性】
技术研发人员：陈映，曹松，任必为，郑翔，宋君，陶海，
申请(专利权)人：北京文安智能技术股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人