当前位置: 首页 > 专利查询>鹏城实验室专利>正文

基于二值神经网络模型的图像分类方法以及相关设备技术

技术编号:38681688 阅读:10 留言:0更新日期:2023-09-02 22:54
本申请涉及人工智能技术领域,提供了一种基于二值神经网络模型的图像分类方法以及相关设备,基于二值神经网络模型的图像分类方法利用全精度神经网络模型对属于相同网络结构的第一神经网络模型进行逐层知识蒸馏得到的第二神经网络模型,能够使得第二神经网络模型充分学习到全精度神经网络模型的知识,之后再将第二神经网络模型的权重参数固定为1比特得到二值神经网络模型,能够极大程度地减少模型推理过程中占用的存储空间以及计算资源,利用该二值神经网络模型能够在诸如嵌入式设备或移动设备等存储空间和计算资源有限的微型设备上实现准确高效的图像分类。备上实现准确高效的图像分类。备上实现准确高效的图像分类。

【技术实现步骤摘要】
基于二值神经网络模型的图像分类方法以及相关设备


[0001]本申请涉及人工智能
,尤其涉及一种基于二值神经网络模型的图像分类方法以及相关设备。

技术介绍

[0002]随着机器学习的快速发展,神经网络模型的规模也越来越大,正在经历从深度学习进一步向大模型发展的时期。在图像分类领域中,往往会将用于图像分类的神经网络模型部署到嵌入式设备或移动设备中,由于嵌入式设备或移动设备的存储空间以及计算资源有限,利用全精度的神经网络模型难以在嵌入式设备或移动设备上进行高效的图像分类推理。因此,如何在嵌入式设备或移动设备等微型设备上实现准确高效的图像分类成为亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种基于二值神经网络模型的图像分类方法、装置、电子设备及计算机可读存储介质,能够在嵌入式设备或移动设备等微型设备上实现准确高效的图像分类。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种基于二值神经网络模型的图像分类方法,所述方法包括:获取待分类图像;将所述待分类图像输入至预设的二值神经网络模型,以通过所述二值神经网络模型得到所述待分类图像对应的分类预测结果;其中,所述二值神经网络模型通过以下步骤离线量化得到:基于预训练好的全精度神经网络模型对预设的第一神经网络模型进行参数初始化,得到第二神经网络模型,其中,所述全精度神经网络模型和所述第一神经网络模型的网络结构相同;从完整数据集的每个样本类别中抽取至少一个样本数据作为校准样本,得到多个所述校准样本以及所述校准样本对应的标签值;以所述全精度神经网络模型为教师模型,基于所述校准样本以及所述校准样本对应的标签值对所述第二神经网络模型所包括的各层网络从前往后逐层进行知识蒸馏,以更新所述第二神经网络模型的权重参数,得到第三神经网络模型;对所述第三神经网络模型进行二值量化,得到所述二值神经网络模型。
[0005]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,在更新所述第二神经网络模型的权重参数的过程中,所述方法包括:对于所述第二神经网络模型中的各层网络,当模型梯度的趋势为使权重参数的绝对值变大,基于第一预设比例更新所述第二神经网络模型的权重参数,所述第一预设比例的取值范围为0到1;
所述第二神经网络模型更新后的权重参数通过以下公式表示:其中,所述为所述第二神经网络模型更新后的权重参数,所述为所述第二神经网络模型更新前的权重参数,所述为第一预设比例,所述为学习率,所述为模型梯度。
[0006]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,所述方法还包括:对于所述第二神经网络模型中的各层网络,当更新前的权重参数与模型梯度的数值符号一致,确定所述模型梯度的趋势为使权重参数的绝对值变大。
[0007]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,所述基于预训练好的全精度神经网络模型对预设的第一神经网络模型进行参数初始化,得到第二神经网络模型,包括:获取预训练好的全精度神经网络模型中各层网络的权重参数;从所述全精度神经网络模型中各层网络对应的权重参数中确定最大参数值和最小参数值,根据所述最大参数值和所述最小参数值确定各层网络对应的权重参数零点值和权重参数幅度值;其中,所述权重参数零点值为所述最大参数值和所述最小参数值之间的平均值,所述权重参数幅度值为所述最大参数值和所述最小参数值之间的绝对差值的一半;基于所述权重参数零点值和所述权重参数幅度值对预设的第一神经网络模型中的各层网络进行参数初始化,得到第二神经网络模型;所述第二神经网络模型的权重参数通过以下公式表示:其中,所述表征所述第二神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的所述权重参数零点值,所述表征所述全精度神经网络模型中第i层网络的所述权重参数幅度值。
[0008]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,所述基于预训练好的全精度神经网络模型对预设的第一神经网络模型进行参数初始化,得到第二神经网络模型,包括:获取预训练好的全精度神经网络模型中各层网络的权重参数;根据所述全精度神经网络模型中各层网络对应的权重参数确定各层网络对应的权重参数平均值和权重参数标准差;根据所述权重参数平均值和所述权重参数标准差对预设的第一神经网络模型中的各层网络进行参数初始化,得到第二神经网络模型;所述第二神经网络模型的权重参数通过以下公式表示:其中,所述表征所述第二神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第
i层网络的所述权重参数平均值,所述表征所述全精度神经网络模型中第i层网络的所述权重参数标准差。
[0009]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,在所述知识蒸馏的过程中,所述方法包括:将所述校准样本输入至所述全精度神经网络模型,以通过所述校准样本在所述全精度神经网络模型所包括的各层网络中进行前向计算,得到所述全精度神经网络模型中各层网络对应的第一输出数据;将所述校准样本输入至作为学生模型的所述第二神经网络模型,以通过所述校准样本在所述第二神经网络模型所包括的各层网络中进行前向计算,得到所述第二神经网络模型中各层网络对应的第二输出数据;基于所述第一输出数据、所述第二输出数据以及所述校准样本对应的标签值,对所述第二神经网络模型所包括的各层网络从前往后逐层进行知识蒸馏,以更新所述第二神经网络模型的权重参数,得到第三神经网络模型。
[0010]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,所述基于所述第一输出数据、所述第二输出数据以及所述校准样本对应的标签值,对所述第二神经网络模型所包括的各层网络从前往后逐层进行知识蒸馏,包括:对于所述第二神经网络模型的中间网络层,根据所述第一输出数据和所述第二输出数据确定第一损失值;在固定所述第二神经网络模型中除当前网络之外的各层网络的情况下,根据所述第一损失值更新当前网络对应的权重参数。
[0011]根据本申请一些实施例提供的基于二值神经网络模型的图像分类方法,所述基于所述第一输出数据、所述第二输出数据以及所述校准样本对应的标签值,对所述第二神经网络模型所包括的各层网络从前往后逐层进行知识蒸馏,包括:对于所述第二神经网络模型的最后一层网络,根据所述第一输出数据、所述第二输出数据以及所述校准样本对应的标签值确定第二损失值;在固定所述第二神经网络模型中除最后一层网络之外的各层网络的情况下,根据所述第二损失值更新所述第二神经网络模型的最后一层网络层的权重参数。
[0012]为实现上述目的,本申请实施例的第二方面提出了一种基于二值神经网络模型的图像分类装置,所述图像分类装置包括:第一获取模块,用于获取待分类图像;第一输入模块,用于将所述待分类图像输入至预设的二值神经网络模型,以通过所述二值神经网络模型得到所述待分类图像对应的分类预测结果;其中,所述二值神本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于二值神经网络模型的图像分类方法,其特征在于,所述方法包括:获取待分类图像;将所述待分类图像输入至预设的二值神经网络模型,以通过所述二值神经网络模型得到所述待分类图像对应的分类预测结果;其中,所述二值神经网络模型通过以下步骤离线量化得到:基于预训练好的全精度神经网络模型对预设的第一神经网络模型进行参数初始化,得到第二神经网络模型,其中,所述全精度神经网络模型和所述第一神经网络模型的网络结构相同;从完整数据集的每个样本类别中抽取至少一个样本数据作为校准样本,得到多个所述校准样本以及所述校准样本对应的标签值;以所述全精度神经网络模型为教师模型,基于所述校准样本以及所述校准样本对应的标签值对所述第二神经网络模型所包括的各层网络从前往后逐层进行知识蒸馏,以更新所述第二神经网络模型的权重参数,得到第三神经网络模型;对所述第三神经网络模型进行二值量化,得到所述二值神经网络模型。2.根据权利要求1所述的图像分类方法,其特征在于,在更新所述第二神经网络模型的权重参数的过程中,所述方法包括:对于所述第二神经网络模型中的各层网络,当模型梯度的趋势为使权重参数的绝对值变大,基于第一预设比例更新所述第二神经网络模型的权重参数,所述第一预设比例的取值范围为0到1;所述第二神经网络模型更新后的权重参数通过以下公式表示:;其中,所述为所述第二神经网络模型更新后的权重参数,所述为所述第二神经网络模型更新前的权重参数,所述为第一预设比例,所述为学习率,所述为模型梯度。3.根据权利要求2所述的图像分类方法,其特征在于,所述方法还包括:对于所述第二神经网络模型中的各层网络,当更新前的权重参数与模型梯度的数值符号一致,确定所述模型梯度的趋势为使权重参数的绝对值变大。4.根据权利要求1所述的图像分类方法,其特征在于,所述基于预训练好的全精度神经网络模型对预设的第一神经网络模型进行参数初始化,得到第二神经网络模型,包括:获取预训练好的全精度神经网络模型中各层网络的权重参数;从所述全精度神经网络模型中各层网络对应的权重参数中确定最大参数值和最小参数值,根据所述最大参数值和所述最小参数值确定各层网络对应的权重参数零点值和权重参数幅度值;其中,所述权重参数零点值为所述最大参数值和所述最小参数值之间的平均值,所述权重参数幅度值为所述最大参数值和所述最小参数值之间的绝对差值的一半;基于所述权重参数零点值和所述权重参数幅度值对预设的第一神经网络模型中的各层网络进行参数初始化,得到第二神经网络模型;所述第二神经网络模型的权重参数通过以下公式表示:;
其中,所述表征所述第二神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的所述权重参数零点值,所述表征所述全精度神经网络模型中第i层网络的所述权重参数幅度值。5.根据权利要求1所述的图像分类方法,其特征在于,所述基于预训练好的全精度神经网络模型对预设的第一神经网络模型进行参数初始化,得到第二神经网络模型,包括:获取预训练好的全精度神经网络模型中各层网络的权重参数;根据所述全精度神经网络模型中各层网络对应的权重参数确定各层网络对应的权重参数平均值和权重参数标准差;根据所述权重参数平均值和所述权重参数标准差对预设的第一神经网络模型中的各层网络进行参数初始化,得到第二神经网络模型;所述第二神经网络模型的权重参数通过以下公式表示:;其中,所述表征所述第二神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的权重参数,所述表征所述全精度神经网络模型中第i层网络的所述权重参数平均值,所述表征所述全精度神经网络模型中第i层网络的所述权重参数标准差。6.根据权利要求1所述的图像分类方法,其特征在于,在所述知识蒸馏的过程中,所述方法包括:将所述校准样...

【专利技术属性】
技术研发人员:王耀威李天翔王乾蔚黄钰均陈斌夏树涛
申请(专利权)人:鹏城实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1