目标检测模型的训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:34893056 阅读:19 留言:0更新日期:2022-09-10 13:52
本发明专利技术揭示了一种目标检测模型的训练方法、装置、电子设备及存储介质,涉及目标检测领域。该方法包括:获取至少两组当前超参数以及各组当前超参数对应的当前目标检测模型;其中,各个当前目标检测模型是基于各组当前超参数对初始目标检测模型进行训练得到的;基于各个当前目标检测模型的精度,对各组当前超参数进行优化,得到至少两组候选超参数,并得到各组候选超参数对应的候选目标检测模型;基于各个候选目标检测模型,得到最优目标检测模型。采用该方法可以保证了确定的最优目标检测模型的精度较高,从而可以保证利用最优目标检测模型进行目标检测,得到的结果更加准确。得到的结果更加准确。得到的结果更加准确。

【技术实现步骤摘要】
目标检测模型的训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及目标检测领域,具体涉及一种目标检测模型的训练方法、装置、电子设备及存储介质。

技术介绍

[0002]深度学习技术在图像目标检测任务中具有较高的技术成熟度,因此目标检测神经网络被广泛引入能源、交通等多个行业。然而面向行业的目标检测任务的样本与通用数据集存在极大的差异,体现在样本数量少、类别不平衡明显等方面。因此对于通用数据集有效的神经网络超参数取值未必能在面向行业应用的目标检测神经网络中取得较佳的效果。
[0003]现有技术中,各个行业现有的自动机器学习研究更注重于对神经网络子模块、网络层数、神经元数量等网络结构相关参数的寻优,而将优化器参数、损失函数形式与尺度作为主要寻优对象的研究较少。
[0004]因此,虽然采用学界常用的自动机器学习范式可以得到较为普适的神经网络结构,但直接套用此类方法利用行业应用的训练数据集进行寻优往往会使得神经网络模型过拟合,而不能得到很好的效果。

技术实现思路

[0005]有鉴于此,本专利技术实施例提供了一种目标检测模型的训练方法、装置、电子设备及存储介质,旨在解决现有技术中检测模型训练不准确的问题。
[0006]根据第一方面,本专利技术实施例提供了一种目标检测模型的训练方法,包括:
[0007]获取至少两组当前超参数以及各组当前超参数对应的当前目标检测模型;其中,各个当前目标检测模型是基于各组当前超参数对初始目标检测模型进行训练得到的;
[0008]基于各个当前目标检测模型的精度,对各组当前超参数进行优化,得到至少两组候选超参数,并得到各组候选超参数对应的候选目标检测模型;
[0009]基于各个候选目标检测模型,得到最优目标检测模型。
[0010]本专利技术实施例提供的目标检测模型的训练方法,获取至少两组当前超参数以及各组当前超参数对应的当前目标检测模型。然后,基于各个当前目标检测模型的精度,对各组当前超参数进行优化,得到至少两组候选超参数,并得到各组候选超参数对应的候选目标检测模型。基于各个当前目标检测模型的精度,将当前超参数作为基线参与优化,避免不同阶段间的超参数缺乏对比而导致的超参数过拟合,从而保证了得到的候选超参数的准确性,进而保证了得到的各组候选超参数对应的候选目标检测模型的准确性。基于各个候选目标检测模型,得到最优目标检测模型。从而保证了确定的最优目标检测模型的精度较高。从而可以保证利用最优目标检测模型进行目标检测,得到的结果更加准确。上述方法,通过对最优目标检测模型对应的超参数进行优化,保证了最终训练得到的最优目标检测模型的准确性。
[0011]结合第一方面,在第一方面第一实施方式中,基于各个当前目标检测模型的精度,
对各组当前超参数进行优化,得到至少两组候选超参数,包括:
[0012]基于各个当前目标检测模型的精度,对各组当前超参数进行多次变异和/或交叉处理,得到多组待定超参数;
[0013]获取各组待定超参数的准确度;
[0014]基于各组待定超参数的准确度,得到至少两组候选超参数。
[0015]本专利技术实施例提供的目标检测模型的训练方法,基于各个当前目标检测模型的精度,对各组当前超参数进行多次变异和/或交叉处理,得到多组待定超参数,从而完成了对各组当前超参数的优化。然后,获取各组待定超参数的准确度,基于各组待定超参数的准确度,得到至少两组候选超参数,从而保证了得到的至少两组候选超参数的准确度较高。
[0016]结合第一方面第一实施方式,在第一方面第二实施方式中,对各组当前超参数进行多次变异和/或交叉处理,得到多组待定超参数,包括:每次对各组当前超参数进行变异和/或交叉处理,得到各组当前超参数对应的备选超参数;
[0017]基于各组备选超参数对初始目标检测模型进行预设轮数训练,确定各组备选超参数的准确度;预设轮数与各组当前超参数对应的优化次数呈正相关;
[0018]基于各组备选超参数的准确度,确定各组待定超参数。
[0019]本专利技术实施例提供的目标检测模型的训练方法,每次对各组当前超参数进行变异和/或交叉处理,得到各组当前超参数对应的备选超参数,保证了得到的各组当前超参数对应的备选超参数的多样性。然后,基于各组备选超参数对初始目标检测模型进行预设轮数训练,确定各组备选超参数的准确度,从而保证了确定的各组备选超参数的准确度。此外,由于预设轮数与各组当前超参数对应的优化次数呈正相关,因此,当当前超参数对应的优化次数较少时,当前超参数的准确度也较低,为了节省训练时间,对各组当前超参数对应的备选超参数进行训练的次数就较少。当当前超参数对应的优化次数较多时,当前超参数的准确度也较高,为了当前超参数的准确度,对各组当前超参数对应的备选超参数进行训练的次数就较多。然后,基于各组备选超参数的准确度,确定各组待定超参数。从而,可以既保证得到的各组待定超参数的准确度,也节省了训练时间,提高了训练效率。
[0020]结合第一方面第一实施方式,在第一方面第三实施方式中,基于各组待定超参数的准确度,得到至少两组候选超参数,包括:
[0021]根据各组待定超参数的准确度,确定准确度最高的待定超参数为目标候选超参数;
[0022]获取对各组当前超参数进行最后一次变异和/或交叉处理,得到的最后至少两组待定超参数;
[0023]基于目标候选超参数以及最后至少两组待定超参数,生成至少两组候选超参数。
[0024]本专利技术实施例提供的目标检测模型的训练方法,根据各组待定超参数的准确度,确定准确度最高的待定超参数为目标候选超参数,保证了确定的目标候选超参数的准确度较高。然后,获取对各组当前超参数进行最后一次变异和/或交叉处理,得到的最后至少两组待定超参数,保证了最后至少两组待定超参数为经过多次优化变异后的待定超参数。然后,基于目标候选超参数以及最后至少两组待定超参数,生成至少两组候选超参数,保证了生成的至少两组候选超参数的准确性。
[0025]结合第一方面第三实施方式,在第一方面第四实施方式中,至少两组大于等于三
组,基于目标候选超参数以及最后至少两组待定超参数,生成至少两组候选超参数,包括:
[0026]对目标候选超参数进行复制,生成至少两组目标候选超参数;
[0027]对最后至少两组待定超参数,进行变异和/或交叉处理,生成至少一组备用候选超参数;
[0028]将至少两组目标候选超参数以及至少一组备用候选超参数进行组合,生成至少三组候选超参数。
[0029]本专利技术实施例提供的目标检测模型的训练方法,对目标候选超参数进行复制,生成至少两组目标候选超参数,减少了目标候选超参数发生异常,导致模型训练不准确的可能。然后,对最后至少两组待定超参数,进行变异和/或交叉处理,生成至少一组备用候选超参数;将至少两组目标候选超参数以及至少一组备用候选超参数进行组合,生成至少三组候选超参数,既保证了生成的至少三组候选超参数的准确度,也实现了对当前超参数进行优化,进而保证本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种目标检测模型的训练方法,其特征在于,包括:获取至少两组当前超参数以及各组所述当前超参数对应的当前目标检测模型;其中,各个所述当前目标检测模型是基于各组所述当前超参数对初始目标检测模型进行训练得到的;基于各个所述当前目标检测模型的精度,对各组所述当前超参数进行优化,得到至少两组候选超参数,并得到各组所述候选超参数对应的候选目标检测模型;基于各个所述候选目标检测模型,得到最优目标检测模型。2.根据要求1所述的方法,其特征在于,所述基于各个所述当前目标检测模型的精度,对各组所述当前超参数进行优化,得到至少两组候选超参数,包括:基于各个所述当前目标检测模型的精度,对各组所述当前超参数进行多次变异和/或交叉处理,得到多组待定超参数;获取各组所述待定超参数的准确度;基于各组所述待定超参数的准确度,得到至少两组所述候选超参数。3.根据权利要求2所述的方法,其特征在于,所述对各组所述当前超参数进行多次变异和/或交叉处理,得到多组待定超参数,包括:每次对各组所述当前超参数进行变异和/或交叉处理,得到各组所述当前超参数对应的备选超参数;基于各组所述备选超参数对所述初始目标检测模型进行预设轮数训练,确定各组所述备选超参数的准确度;所述预设轮数与各组所述当前超参数对应的优化次数呈正相关;基于各组所述备选超参数的准确度,确定各组所述待定超参数。4.根据权利要求2所述的方法,其特征在于,所述基于各组所述待定超参数的准确度,得到至少两组所述候选超参数,包括:根据各组所述待定超参数的准确度,确定准确度最高的待定超参数为目标候选超参数;获取对各组所述当前超参数进行最后一次变异和/或交叉处理,得到的最后至少两组待定超参数;基于所述目标候选超参数以及所述最后至少两组待定超参数,生成至少两组所述候选超参数。5.根据权利要求4所述的方法,其特征在于,所述至少两组大于等于三组,所述基于所述...

【专利技术属性】
技术研发人员:刘思言王博高昆仑张希杨峰娄竞李信王艺霏李欣怡
申请(专利权)人:国网冀北电力有限公司信息通信分公司国网冀北电力有限公司国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1