一种数据增广策略选择方法、装置及系统制造方法及图纸

技术编号:32221315 阅读:20 留言:0更新日期:2022-02-09 17:26
本申请实施例提供了一种数据增广策略选择方法、装置及系统。方案如下:获取多个数据增广策略各自对应的第一检测模型;针对每一数据增广策略,利用该数据增广策略对应的第一检测模型,对第三数据集中第三样本图像中的目标物进行检测,得到各检测框的置信度;根据该数据增广策略所对应的检测框的数量和/或检测框的置信度,计算该数据增广策略对应的目标物检测性能值;基于每一数据增广策略对应的目标物检测性能值,选择目标数据增广策略。通过本申请实施例提供的技术方案,提高了确定出的目标数据增广策略的泛化能力,使得数据增广技术适用于无监督学习场景的目标物检测过程。于无监督学习场景的目标物检测过程。于无监督学习场景的目标物检测过程。

【技术实现步骤摘要】
一种数据增广策略选择方法、装置及系统


[0001]本申请涉及目标检测
,特别是涉及一种数据增广策略选择方法、装置及系统。

技术介绍

[0002]目前,在有监督学习场景的目标物检测过程中,可以利用目标数据增广策略对预先设定的训练数据集进行数据增广处理。这将有效增加训练数据集中的训练数据的数量,提高训练数据集的多样化,从而提高了根据数据增广处理后的训练数据集训练得到的检测模型的泛化能力。
[0003]在上述目标物检测过程中,上述目标数据增广策略需要是基于包括标识信息的验证数据集确定。
[0004]上述在确定目标数据增广策略时,需要依赖包括标识信息的验证数据集。然而,在无监督学习场景中,由于受到标识信息获取的高经济性的影响,无法获取到足够数量的包括标识信息的验证数据集,导致上述包括标识信息的数据集并不具备较高的泛化能力,这严重影响了确定出的目标数据增广策略的泛化能力,从而导致相关技术中的数据增广技术并不适用于无监督学习场景的目标物检测过程。

技术实现思路

[0005]本申请实施例的目的在于提供一种数据增广策略选择方法、装置及系统,以提高确定出的目标数据增广策略的泛化能力,从而使得数据增广技术适用于无监督学习场景的目标物检测过程。具体技术方案如下:
[0006]本申请实施例提供了一种数据增广策略选择方法,所述方法包括:
[0007]获取多个数据增广策略各自对应的第一检测模型;每一数据增广策略对应的第一检测模型是基于该数据增广策略对应的第一数据集训练得到的,每一数据增广策略对应的第一数据集是:基于该数据增广策略对第二数据集进行数据增广处理得到的;
[0008]针对每一数据增广策略,利用该数据增广策略对应的第一检测模型,对第三数据集中第三样本图像中的目标物进行检测,得到各检测框的置信度;
[0009]根据该数据增广策略所对应的检测框的数量和/或检测框的置信度,计算该数据增广策略对应的目标物检测性能值;
[0010]基于每一数据增广策略对应的目标物检测性能值,选择目标数据增广策略。
[0011]可选的,所述获取多个数据增广策略各自对应的第一检测模型的步骤,包括:
[0012]获取所述第二数据集;
[0013]获取多个数据增广策略;
[0014]针对每一数据增广策略,利用该数据增广策略对所述第二数据集进行数据增广处理,得到每一数据增广策略对应的第一数据集;
[0015]针对每一数据增广策略,利用该数据增广策略对应的第一数据集,对预设检测模
型进行训练,得到每一数据增广策略所对应的第一检测模型。
[0016]可选的,所述获取多个数据增广策略的步骤,包括:
[0017]基于候选库中包括的多个数据增广算法,选取多组种子策略,每组种子策略中包括第一数量个数据增广算法;
[0018]针对每组种子策略,基于第二数量,以及该组种子策略中各数据增广算法所对应随机概率区间/幅值变换区间的最大值和最小值,确定该组种子策略中各数据增广算法所对应的随机概率值/幅值,得到多个数据增广策略。
[0019]可选的,针对任一数据增广策略对应的第一数据集,采用以下步骤训练得到该数据增广策略对应的第一检测模型:
[0020]获取所述第一数据集;所述第一数据集包括多个第一样本图像,以及每一第一样本图像中目标物的第一标识信息;
[0021]利用预设检测模型,对每一第一样本图像中的目标物进行检测,得到第一检测结果;
[0022]基于所述第一检测结果以及所述第一标识信息,计算所述预设检测模型的第一损失值;
[0023]若第一差值大于第一预设阈值,则调整所述预设检测模型的参数,并返回执行所述利用预设检测模型,对每一第一样本图像中的目标物进行检测,得到第一检测结果的步骤;所述第一差值为本轮训练得到的第一损失值与上一轮训练得到第一损失值间的差值;
[0024]若所述第一差值不大于所述第一预设阈值,则将当前的预设检测模型确定为训练好的第一检测模型。
[0025]可选的,所述第一标识信息包括指示目标物所在区域的区域标识,以及指示目标物的类别的类别标识;
[0026]所述基于所述第一检测结果以及所述第一标识信息,计算所述预设检测模型的第一损失值的步骤,包括:
[0027]计算所述第一检测结果中检测框所在的区域,与所述第一数据集中区域标识所指示的目标物所在的区域间的第一误差值;
[0028]计算所述第一检测结果中检测框所对应目标物的类别,与所述第一数据集中类别标识所指示目标物的类别间的第二误差值;
[0029]计算所述第一误差值和所述第二误差值和值,作为所述预设检测模型的第一损失值。
[0030]可选的,所述根据该数据增广策略所对应的检测框的数量和/或检测框的置信度,计算该数据增广策略对应的目标物检测性能值的步骤,包括:
[0031]计算该数据增广策略所对应的检测框的数量的和值,作为该数据增广策略对应的目标物检测性能值;和/或
[0032]计算该数据增广策略所对应的检测框的置信度的和值,作为该数据增广策略对应的目标物检测性能值。
[0033]可选的,所述基于每一数据增广策略对应的目标物检测性能值,选择目标数据增广策略的步骤,包括:
[0034]将所述多个数据增广策略中所述目标物检测性能值最高的数据增广策略确定为
目标数据增广策略。
[0035]可选的,所述方法还包括:
[0036]获取第四数据集和第五数据集;其中,所述第四数据集包括多个第四样本图像,以及每一第四样本图像中目标物所对应的第三标识信息,所述第五数据集包括多个第五样本图像;
[0037]利用所述目标数据增广策略,对所述第四数据集进行数据增广处理,得到第六数据集;
[0038]利用所述目标数据增广策略对应的第一检测模型,对所述第六数据集中的每一第六样本图像中的目标物进行检测,得到第二检测结果;
[0039]利用所述目标数据增广策略对应的第一检测模型,对所述第五数据集中的每一第五样本图像中的目标物进行检测,得到第三检测结果;
[0040]基于所述第二检测结果和所述第三检测结果,计算所述目标数据增广策略对应的第一检测模型的第二损失值;
[0041]若第二差值大于第二预设阈值,则对所述目标数据增广策略对应的第一检测模型的参数进行微调,并返回执行所述利用所述目标数据增广策略对应的第一检测模型,对所述第六数据集中的每一第六样本图像中的目标物进行检测,得到第二检测结果的步骤;所述第二差值为本轮训练得到的第二损失值与上一轮训练得到第二损失值间的差值;
[0042]若所述第二差值不大于所述第二预设阈值,则将当前的第一目标物检测模型确定为训练好的第二检测模型。
[0043]可选的,所述方法还包括:
[0044]获取待检测图像;
[0045]利用所述第二检测模型,对所述待检测图像进行目标物检测,得到第四检测结果。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据增广策略选择方法,其特征在于,所述方法包括:获取多个数据增广策略各自对应的第一检测模型;每一数据增广策略对应的第一检测模型是基于该数据增广策略对应的第一数据集训练得到的,每一数据增广策略对应的第一数据集是:基于该数据增广策略对第二数据集进行数据增广处理得到的;针对每一数据增广策略,利用该数据增广策略对应的第一检测模型,对第三数据集中第三样本图像中的目标物进行检测,得到各检测框的置信度;根据该数据增广策略所对应的检测框的数量和/或检测框的置信度,计算该数据增广策略对应的目标物检测性能值;基于每一数据增广策略对应的目标物检测性能值,选择目标数据增广策略。2.根据权利要求1所述的方法,其特征在于,所述获取多个数据增广策略各自对应的第一检测模型的步骤,包括:获取所述第二数据集;获取多个数据增广策略;针对每一数据增广策略,利用该数据增广策略对所述第二数据集进行数据增广处理,得到每一数据增广策略对应的第一数据集;针对每一数据增广策略,利用该数据增广策略对应的第一数据集,对预设检测模型进行训练,得到每一数据增广策略所对应的第一检测模型。3.根据权利要求2所述的方法,其特征在于,所述获取多个数据增广策略的步骤,包括:基于候选库中包括的多个数据增广算法,选取多组种子策略,每组种子策略中包括第一数量个数据增广算法;针对每组种子策略,基于第二数量,以及该组种子策略中各数据增广算法所对应随机概率区间/幅值变换区间的最大值和最小值,确定该组种子策略中各数据增广算法所对应的随机概率值/幅值,得到多个数据增广策略。4.根据权利要求1所述的方法,其特征在于,针对任一数据增广策略对应的第一数据集,采用以下步骤训练得到该数据增广策略对应的第一检测模型:获取所述第一数据集;所述第一数据集包括多个第一样本图像,以及每一第一样本图像中目标物的第一标识信息;利用预设检测模型,对每一第一样本图像中的目标物进行检测,得到第一检测结果;基于所述第一检测结果以及所述第一标识信息,计算所述预设检测模型的第一损失值;若第一差值大于第一预设阈值,则调整所述预设检测模型的参数,并返回执行所述利用预设检测模型,对每一第一样本图像中的目标物进行检测,得到第一检测结果的步骤;所述第一差值为本轮训练得到的第一损失值与上一轮训练得到第一损失值间的差值;若所述第一差值不大于所述第一预设阈值,则将当前的预设检测模型确定为训练好的第一检测模型。5.根据权利要求4所述的方法,其特征在于,所述第一标识信息包括指示目标物所在区域的区域标识,以及指示目标物的类别的类别标识;所述基于所述第一检测结果以及所述第一标识信息,计算所述预设检测模型的第一损失值的步骤,包括:
计算所述第一检测结果中检测框所在的区域,与所述第一数据集中区域标识所指示的目标物所在的区域间的第一误差值;计算所述第一检测结果中检测框所对应目标物的类别,与所述第一数据集中类别标识所指示目标物的类别间的第二误差值;计算所述第一误差值和所述第二误差值和值,作为所述预设检测模型的第一损失值。6.根据权利要求1所述的方法,其特征在于,所述根据该数据增广策略所对应的检测框的数量和/或检测框的置信度,计算该数据增广策略对应的目标物检测性能值的步骤,包括:计算该数据增广策略所对应的检测框的数量的和值,作为该数据增广策略对应的目标物检测性能值;和/或计算该数据增广策略所对应的检测框的置信度的和值,作为该数据增广策略对应的目标物检测性能值。7.根据权利要求1所述的方法,其特征在于,所述基于每一数据增广策略对应的目标物...

【专利技术属性】
技术研发人员:李朝阳浦世亮赵龙陈伟杰杨世才谢迪
申请(专利权)人:杭州海康威视数字技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1