目标检测方法、模型的训练方法及装置、设备、存储介质制造方法及图纸

技术编号：33204389 阅读：10 留言：0更新日期：2022-04-24 00:47

本申请实施例公开了一种目标检测方法、模型的训练方法及装置、设备、存储介质，其中，所述训练方法包括：采用待训练的检测模型，对获取的训练图像集进行目标检测，得到预测的检测结果；确定所述训练图像集中不同类别的正负样本的不平衡程度；基于所述预测的检测结果和所述不同类别的正负样本的不平衡程度，确定所述预测的检测结果在所述不同类别中的损失；利用所述损失对所述待训练的检测模型中的网络参数进行更新，直至更新后的检测模型满足收敛条件。件。件。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测方法、模型的训练方法及装置、设备、存储介质

[0001]本申请实施例涉及计算机视觉技术，涉及但不限于一种目标检测方法、模型的训练方法及装置、设备、存储介质。

技术介绍

[0002]数据的长尾分布是目标检测算法在现实世界中所面临的重要问题。一般的目标检测算法都应用于相对平衡的数据分布场景下，而长尾分布带来的不平衡问题往往会极大地影响到目标检测算法的精确度。现有的长尾目标检测算法提出了样本重采样、损失重加权等解决方案用于克服长尾分布问题。
[0003]然而，现有的针对长尾分布数据的目标检测框架主要是基于二阶段目标检测器进行的，目前仍然没有针对长尾分布数据的单阶段检测的相关内容。

技术实现思路

[0004]有鉴于此，本申请实施例提供一种目标检测方法、模型的训练方法及装置、设备、存储介质。
[0005]本申请实施例的技术方案是这样实现的：
[0006]第一方面，本申请实施例提供一种检测模型的训练方法，所述方法包括：采用待训练的检测模型，对获取的训练图像集进行目标检测，得到预测的检测结果；确定所述训练图像集中不同类别的正负样本的不平衡程度；基于所述预测的检测结果和所述不同类别的正负样本的不平衡程度，确定所述预测的检测结果在所述不同类别中的损失；利用所述损失对所述待训练的检测模型中的网络参数进行更新，直至更新后的检测模型满足收敛条件。
[0007]通过上述方式，能够利用不同类别的正负样本的不平衡程度，解决前景类别间样本不平衡的问题。
[0008]在一些实施例中，所述...

【技术保护点】

【技术特征摘要】
1.一种检测模型的训练方法，其特征在于，所述方法包括：采用待训练的检测模型，对获取的训练图像集进行目标检测，得到预测的检测结果；确定所述训练图像集中不同类别的正负样本的不平衡程度；基于所述预测的检测结果和所述不同类别的正负样本的不平衡程度，确定所述预测的检测结果在所述不同类别中的损失；利用所述损失对所述待训练的检测模型中的网络参数进行更新，直至更新后的检测模型满足收敛条件。2.根据权利要求1所述的训练方法，其特征在于，所述确定所述训练图像集中不同类别的正负样本的不平衡程度，包括：确定所述训练图像集中不同类别的正负样本的累积梯度比；基于所述不同类别的正负样本的累积梯度比，确定所述不同类别的正负样本的不平衡程度。3.根据权利要求1或2所述的方法，其特征在于，所述基于所述预测的检测结果和所述不同类别的正负样本的不平衡程度，确定所述预测的检测结果在所述不同类别中的损失，包括：利用第一超参数对所述不同类别的正负样本的不平衡程度分别进行加权，得到所述不同类别中每一类别的加权结果；其中，所述第一超参数用于控制所述待训练的检测模型对不同类别中稀有类别的正负样本的不平衡程度进行学习的力度；基于所述预测的检测结果和所述每一类别的加权结果，确定所述预测的检测结果在所述每一类别中的损失。4.根据权利要求1至3任一项所述的方法，其特征在于，所述基于所述预测的检测结果和所述不同类别的正负样本的不平衡程度，确定所述预测的检测结果在所述不同类别中的损失，包括：确定所述预测的检测结果的焦点损失；采用所述不同类别的正负样本的不平衡程度对所述焦点损失进行调整，得到所述预测的检测结果在所述不同类别中的损失。5.根据权利要求4所述的方法，其特征在于，所述不同类别至少包括：稀有类别和频繁类别，所述采用所述不同类别的正负样本的不平衡程度对所述焦点损失进行调整，得到所述预测的检测结果在所述不同类别中的损失之后，所述方法还包括：基于基础因子，以及所述稀有类别和所述频繁类别的正负样本的不平衡程度，确定权重因子；其中，所述基础因子用于平衡训练图像中前景区域与背景区域的损失贡献；基于权重因子，调整所述损失中稀有类别相对于频繁类别的损失贡献，得到已优化的损失；所述利用所述损失对所述待训练的检测模型中的网络参数进行更新，包括：利用所述已优化的损失对所述待训练的检测模型中的网络参数进行更新。6.根据权利要求1至5任一项所述的方法，其特征在于，所述利用所述损失对所述待训练的检测模型中的网络参数进行更新，包括：基于所述损失，确定所述待训练的检测模型在更新过程中输出的梯度值；在所述梯度值大于等于预设阈值的情况下，对所述梯度值进行梯度裁切，得到裁切后
的梯度值；基于所述裁切后的梯度值，对所述检测模型中的网络参数进行更新。7.根据权利要求1至6任一项所述的方法，其特征在于，所述方法还包括：基于所述训练图像集中图像的分布情况，确定在预训练阶段对所述待训练的检测模型进行迭代训练的迭代次数；基于所述迭代次数和所述训练图像集，对所述待训练的检测模型进行预训练，得到候选检测模型；所述利用所述损失对所述待训练的检测模型中的网络参数进行更新，直至更新后的检测模型满足收敛条件，包括：利用所述损失对所述候选检测模型中的网络参数进行更新，直至更新后的检测模型满足收敛条件。8.根据权利要求7所述的方法，其特征在于，所述基于所述训练图像集中图像的分布情况，确定在预训练阶段对所述待训练的检测模型进行迭代训练的迭代次数，包括：在所述训...

【专利技术属性】
技术研发人员：李波，姚勇强，谭靖儒，
申请(专利权)人：上海商汤智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人