System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 目标检测模型的量化感知训练方法、装置、设备及介质制造方法及图纸_技高网

目标检测模型的量化感知训练方法、装置、设备及介质制造方法及图纸

技术编号:42698507 阅读:2 留言:0更新日期:2024-09-13 11:54
本发明专利技术适用计算机视觉感知领域和模型压缩技术领域,提供了一种目标检测模型的量化感知训练方法,该方法包括:构建待量化的目标检测模型的目标损失函数,该目标损失函数包括分类损失函数、回归损失函数以及任务和谐约束损失函数,基于目标损失函数,对目标检测模型进行量化感知训练,直至该目标损失函数收敛,从而使得分类任务和回归任务之间的关系变得越来越和谐,避免了不和谐的预测框的出现,提高了量化后目标检测模型在NMS后的检测性能。

【技术实现步骤摘要】

本专利技术属于计算机视觉感知领域和模型压缩,尤其涉及一种目标检测模型的量化感知训练方法、装置、设备及介质


技术介绍

1、目标检测是计算机视觉领域中的一项关键任务,其主要目标是在图像或视频中识别和定位特定类别的物体。与图像分类任务不同,目标检测要求系统不仅能够确定图像中是否存在目标物体,还需要准确地标定目标的位置,这通常通过在图像中绘制边界框(bounding box)来实现,该边界框框定了目标物体的位置和大小。目标检测的应用非常广泛,涵盖了多个领域,如自动驾驶汽车感知、安防监控、医学图像分析、无人零售等。目标检测在人工智能领域的发展中扮演着重要角色,而深度学习技术,特别是卷积神经网络(cnn)的发展,为目标检测算法的性能提升提供了强大的支持。不断改进的算法和更大规模的标注数据使得目标检测系统在复杂场景和多样化任务中取得了显著的进展。

2、模型量化是一种优化深度学习模型的技术,旨在减小模型的存储需求和计算开销,同时尽可能保持模型的性能。模型量化通过减少模型参数和中间输出的比特数(通常从浮点数减少到较低位的整数或定点数)来实现这一目标。被量化后的深度学习模型可以更高效地部署在嵌入式设备、移动设备或其他资源受限的环境中。按量化过程中是否需要进行训练可将模型量化技术分为两类:(1)训练后量化(ptq,post-training quantization),顾名思义,就是在模型训练后做的量化,一般需要用到校准(calibration)数据,这些数据主要用来统计得到量化参数,因此是不需要标注的,一般百来张即可,而当校准数据集无法获取时,可以通过无数据量化技术来重建和优化量化参数;(2)量化感知训练(qat,quantization aware training):又可分是要从头训练还是微调训练,当比特到4位及以下时,量化会引入大量的噪声,使得信息丢失较多,因此很多方法中需要感知训练介入。

3、在现代目标检测器中,任务不和谐(task inharmony,ti)问题一直是关注的焦点。通常使用多任务检测框架生成物体的位置坐标和相应的标签,其包括一个分类分支和一个回归分支的两个平行检测头,这种平行设计可能导致分类分数和回归分数(intersectionover union,iou)的分布不一致。当检测器输出的预测框具有较高的分类分数但定位位置较差,或者具有较低的分类分数但定位位置准确时,非极大值抑制(non-maximumsuppression,nms)后该检测器的检测性能会下降。而在检测器进行量化感知训练后,ti问题会进一步恶化,这被认为是量化后检测器性能下降的主要原因之一。以学习步长量化(learned step size quantization,lsq)算法为例,被量化后的检测器生成了一个典型的不一致边界框的例子,如附图1(a)所示,图中有两个不和谐的候选框(一个黄色边界框(即分类得分为0.39对应的框)和一个蓝色边界框(即分类得分为0.80对应的框)),还有一个用红色标记的真实框,在nms过程后,黄色框具有较高的iou(交并比)但分类得分较低,其将被不太准确的蓝色框抑制,换句话说,次优结果被保留,而最佳结果被忽视。


技术实现思路

1、本专利技术的目的在于提供一种目标检测模型的量化感知训练方法、装置、设备及存储介质,旨在解决由于现有技术在对目标检测模型进行量化感知训练后会加重任务不和谐问题,导致了大量不和谐的预测框的出现,造成量化后的检测器在非极大值抑制后的检测性能下降的问题。

2、一方面,本专利技术提供了一种目标检测模型的量化感知训练方法,所述方法包括下述步骤:

3、构建待量化的目标检测模型的目标损失函数,所述目标损失函数包括分类损失函数、回归损失函数以及任务和谐约束损失函数;

4、基于所述目标损失函数,对所述目标检测模型进行量化感知训练,直至所述目标损失函数收敛。

5、优选地,基于所述目标损失函数,对所述目标检测模型进行量化感知训练的步骤,包括:

6、在前向传播过程中,基于预设的量化策略和训练数据集,对所述目标检测模型的权重和激活值进行模拟量化;

7、根据量化后的所述目标检测模型在所述训练数据集上的分类分数和回归分数,使用预设的任务相关性指标公式计算任务相关性指标;

8、基于所述任务相关性指标,使用所述任务和谐约束损失函数计算约束损失值;

9、基于所述约束损失值,使用所述目标损失函数计算量化后的所述目标检测模型的目标损失值;

10、通过反向传播,计算所述目标损失值对所述目标检测模型中可学习参数的梯度,根据所述梯度对所述可学习参数进行更新。

11、优选地,所述任务和谐约束损失函数包括任务相关损失函数、和谐交并比损失函数,基于所述任务相关性指标,使用所述任务和谐约束损失函数计算约束损失值的步骤,包括:

12、根据所述任务相关性指标,使用所述任务相关损失函数计算任务相关损失值;

13、根据量化后的所述目标检测模型在所述训练数据集上的回归分数,使用所述和谐交并比损失函数计算和谐交并比损失值;

14、根据所述任务相关损失值和所述和谐交并比损失值,使用所述任务和谐约束损失函数计算所述约束损失值。

15、优选地,所述任务相关性指标公式为,其中,为所述训练数据集中第个正样本的任务相关性指标,表示由所述目标检测模型的分类分支输出的第个正样本的分类分数,是由所述目标检测模型的回归分支预测的第个正样本的回归分数,和是两个动态因子。

16、优选地,所述任务和谐约束损失函数为,其中,为所述训练数据集中正样本的数量,pos为所述训练数据集中正样本集合,为所述任务相关损失函数,为所述和谐交并比损失函数,为权衡参数。

17、优选地,所述任务相关损失函数为,所述和谐交并比损失函数为,其中,为再加权参数,为超参数。

18、优选地,所述目标损失函数为,其中,, 表示所述训练数据集中负样本的数量,neg为所述训练数据集中负样本集合,为所述分类损失函数,为所述回归损失函数。

19、另一方面,本专利技术提供了一种目标检测模型的量化感知训练装置,所述装置包括:

20、损失函数构建单元,用于构建待量化的目标检测模型的目标损失函数,所述目标损失函数包括分类损失函数、回归损失函数以及任务和谐约束损失函数;

21、检测模型量化单元,用于基于所述目标损失函数,对所述目标检测模型进行量化感知训练,直至所述目标损失函数收敛。

22、另一方面,本专利技术还提供了一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述目标检测模型的量化感知训练方法所述的步骤。

23、另一方面,本专利技术还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述目标检测模型的量化感知训练方法所述的步骤。

本文档来自技高网...

【技术保护点】

1.一种目标检测模型的量化感知训练方法,其特征在于,所述方法包括下述步骤:

2.如权利要求1所述的方法,其特征在于,基于所述目标损失函数,对所述目标检测模型进行量化感知训练的步骤,包括:

3.如权利要求2所述的方法,其特征在于,所述任务和谐约束损失函数包括任务相关损失函数、和谐交并比损失函数,基于所述任务相关性指标,使用所述任务和谐约束损失函数计算约束损失值的步骤,包括:

4.如权利要求3所述的方法,其特征在于,所述任务相关性指标公式为,其中,为所述训练数据集中第个正样本的任务相关性指标,表示由所述目标检测模型的分类分支输出的第个正样本的分类分数,是由所述目标检测模型的回归分支预测的第个正样本的回归分数,和是两个动态因子。

5.如权利要求4所述的方法,其特征在于,所述任务和谐约束损失函数为,其中,为所述训练数据集中正样本的数量,Pos为所述训练数据集中正样本集合,为所述任务相关损失函数,为所述和谐交并比损失函数,为权衡参数。

6.如权利要求5所述的方法,其特征在于,所述任务相关损失函数为,所述和谐交并比损失函数为,其中,为再加权参数,为超参数。

7.如权利要求6所述的方法,其特征在于,所述目标损失函数为,其中,, 表示所述训练数据集中负样本的数量,Neg为所述训练数据集中负样本集合,为所述分类损失函数,为所述回归损失函数。

8.一种目标检测模型的量化感知训练装置,其特征在于,所述装置包括:

9.一种计算设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

...

【技术特征摘要】

1.一种目标检测模型的量化感知训练方法,其特征在于,所述方法包括下述步骤:

2.如权利要求1所述的方法,其特征在于,基于所述目标损失函数,对所述目标检测模型进行量化感知训练的步骤,包括:

3.如权利要求2所述的方法,其特征在于,所述任务和谐约束损失函数包括任务相关损失函数、和谐交并比损失函数,基于所述任务相关性指标,使用所述任务和谐约束损失函数计算约束损失值的步骤,包括:

4.如权利要求3所述的方法,其特征在于,所述任务相关性指标公式为,其中,为所述训练数据集中第个正样本的任务相关性指标,表示由所述目标检测模型的分类分支输出的第个正样本的分类分数,是由所述目标检测模型的回归分支预测的第个正样本的回归分数,和是两个动态因子。

5.如权利要求4所述的方法,其特征在于,所述任务和谐约束损失函数为,其中,为所述训练数据集中正样本的数量,pos为所述训练数据集中正样本集合,为所...

【专利技术属性】
技术研发人员:殷绪成黄泷董志伟张睿尧陈松路陈峰杨春程健
申请(专利权)人:珠海亿智电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1