System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种面向目标检测模型的后训练量化校准方法,同时也涉及相应的后训练量化校准装置,属于数字图像分析。
技术介绍
1、目标检测作为计算机视觉中的一个核心任务,对于识别和定位图像中的对象至关重要。然而,基于深度学习的目标检测模型虽然在性能上取得了突破,但它们在边缘设备上的部署受到计算资源和能源限制的挑战。为了解决这一问题,后训练量化(post-trainingquantization,简写为ptq)技术应运而生,它通过将神经网络模型的浮点数权重和激活映射转换为较低比特宽度的整数形式,从而降低神经网络模型的内存占用并加速推理过程。
2、后训练量化是在神经网络模型训练完成后进行的。它利用整数运算代替浮点运算,以减少神经网络模型的计算复杂性。后训练量化的一个主要优势是它的通用性和低成本,因为它避免了重新训练神经网络模型的需要。然而,后训练量化在目标检测任务中的应用并非没有挑战。目标检测不仅包含分类,还包含更为复杂的回归任务,这使得量化后的目标检测模型在性能上容易受损。
3、目前,大多数后训练量化技术主要关注神经网络模型的主干(backbone)和颈部(neck)的量化,而避免量化对性能影响较大的检测头部。尽管如此,完全量化检测头部可以显著减少计算量和内存占用,但这也带来了量化噪声敏感性、次优缩放因子选择以及权重分布不均匀等问题。这些问题的存在,尤其是在回归任务中,要求我们开发新的量化策略,以适应目标检测中回归任务的独特性,确保量化后的目标检测模型在保持高效推理的同时,也能维持较高的性能水平。
技术实现思路
1、本专利技术所要解决的首要技术问题在于提供一种面向目标检测模型的后训练量化校准方法。
2、本专利技术所要解决的另一技术问题在于提供一种面向目标检测模型的后训练量化校准装置。
3、为实现上述技术目的,本专利技术采用以下的技术方案:
4、根据本专利技术实施例的第一方面,提供一种面向目标检测模型的后训练量化校准方法,包括如下步骤:
5、(1)获取需要进行目标检测的任务和相应的目标图像集合;
6、(2)获取已经预训练好的目标检测模型;
7、(3)对目标检测模型进行后训练量化处理,将目标检测模型的浮点数参数转换为整数形式,同时对目标检测模型的权重分布进行均匀化的调整;
8、(4)利用边界框的置信度和交并比优化量化参数,进行后训练量化校准;
9、(5)输出经过量化校准后的所述目标检测模型,以在对待检测图像进行处理的过程中进行整数计算。
10、其中较优地,所述步骤(3)中,首先对检测头应用可学习对数仿射量化器,然后初始化所有的缩放因子,并通过过滤全局损失联合校准策略对所有可学习参数进行微调。
11、其中较优地,利用所述可学习对数仿射量化器对目标检测模型的权重分布进行均匀化的调整;其中,所述可学习对数仿射量化器用于执行以下操作:
12、获取变量的概率密度函数,通过对数仿射变换将所述概率密度函数由指数函数转换为分段线性空间,以使所述变量的权重分布趋于均匀。
13、其中较优地,将值大于位置参数的变量和值小于位置参数的变量划分成两部分;通过所述对数仿射变换将所述概率密度函数投影到对数空间。
14、其中较优地,所述步骤(4)中,所述过滤全局损失联合校准策略包括如下子步骤:
15、在校准过程中,过滤掉检测头输出的低置信度和低交并比的边界框,以减少量化过程中的噪声干扰;
16、在微调量化缩放因子时,利用高置信度和高交并比的预测框提供精确的梯度信息。
17、其中较优地,过滤掉检测头输出的低置信度和低交并比的边界框,包括如下子步骤:
18、获取检测头输出的带有分类分数的全部边界框;
19、从全部边界框中获取第一目标边界框,其中,第一目标边界框的置信度高于第一预设值,并且第一目标边界框的交并比高于第二预设值;
20、将第一目标边界框以外的其它边界框删除。
21、其中较优地,通过如下子步骤从全部边界框中获取第一目标边界框:
22、在使用全精度检测器校准目标检测模型时,筛选置信度高于第一预设值的第二目标边界框;
23、计算量化后的目标检测模型和原始目标检测模型对应的边界框的交并比,确定交并比高于第二预设值的第三目标边界框;
24、将所述第二目标边界框和所述第三目标边界框的合集作为所述第一目标边界框。
25、其中较优地,通过交叉熵损失函数计算分类损失,通过评估预测边界框与真实边界框之间的差异计算回归损失,联合所述分类损失和所述回归损失计算校准过程中的全局损失。
26、其中较优地,在计算所述全局损失的过程中引入一个可调整的权重因子,用于平衡所述分类损失和所述回归损失。
27、根据本专利技术实施例的第二方面,提供一种面向目标检测模型的后训练量化校准装置,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行上述的后训练量化校准方法。
28、与现有技术相比较,本专利技术实施例在目标检测模型训练完成后,将模型的浮点数参数转换为整数形式,并进行权重分布的均匀化调整,有效降低了目标检测模型在边缘设备部署时的内存占用并加速了推理过程。在校准过程中,利用边界框的置信度和交并比对量化参数进行优化,并通过过滤全局损失联合校准策略减少量化噪声干扰,确保量化后的目标检测模型在保持高效推理的同时,维持较高的目标检测性能。此外,该方法还引入了可学习对数仿射量化器,针对回归任务中非均匀分布的参数进行精细调整,进一步提高了量化后的目标检测模型的性能稳定性。实验结果证实,该方法在不同设置下均展现出优于现有技术的检测性能,体现了其在边缘设备上部署目标检测模型的应用潜力。
本文档来自技高网...【技术保护点】
1.一种面向目标检测模型的后训练量化校准方法,其特征在于包括如下步骤:
2.如权利要求1所述的后训练量化校准方法,其特征在于所述步骤(3)中,首先对检测头应用可学习对数仿射量化器,然后初始化所有的缩放因子,并通过过滤全局损失联合校准策略对所有可学习参数进行微调。
3.如权利要求2所述的后训练量化校准方法,其特征在于利用所述可学习对数仿射量化器对目标检测模型的权重分布进行均匀化的调整;其中,所述可学习对数仿射量化器用于执行以下操作:
4.如权利要求3所述的后训练量化校准方法,其特征在于:
5.如权利要求2所述的后训练量化校准方法,其特征在于所述步骤(4)中,所述过滤全局损失联合校准策略包括如下子步骤:
6.如权利要求5所述的后训练量化校准方法,其特征在于过滤掉检测头输出的低置信度和低交并比的边界框,包括如下子步骤:
7.如权利要求6所述的后训练量化校准方法,其特征在于通过如下子步骤从全部边界框中获取第一目标边界框:
8.如权利要求1所述的后训练量化校准方法,其特征在于:
9.如权利要求8
10.一种面向目标检测模型的后训练量化校准装置,其特征在于包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行权利要求1~9中任意一项所述的后训练量化校准方法。
...【技术特征摘要】
1.一种面向目标检测模型的后训练量化校准方法,其特征在于包括如下步骤:
2.如权利要求1所述的后训练量化校准方法,其特征在于所述步骤(3)中,首先对检测头应用可学习对数仿射量化器,然后初始化所有的缩放因子,并通过过滤全局损失联合校准策略对所有可学习参数进行微调。
3.如权利要求2所述的后训练量化校准方法,其特征在于利用所述可学习对数仿射量化器对目标检测模型的权重分布进行均匀化的调整;其中,所述可学习对数仿射量化器用于执行以下操作:
4.如权利要求3所述的后训练量化校准方法,其特征在于:
5.如权利要求2所述的后训练量化校准方法,其特征在于所述步骤(4)中,所...
【专利技术属性】
技术研发人员:刘祥龙,郭晋阳,丁一芙,冯伟伦,马宇晴,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。