【技术实现步骤摘要】
深度卷积神经网络的混合精度量化方法及相关设备
[0001]本专利技术涉及深度卷积神经网络
,尤其是指一种深度卷积神经网络的混合精度量化方法及相关设备。
技术介绍
[0002]近些年来,随着数据样本的不断丰富,计算单元性能的快速提升,卷积神经网络(convolutional neural network,CNN)凭借着其强大的特征提取和表达能力,在图像分类、目标检测和语义分割等计算机视觉领域,都获得了显著的应用成效。得益于网络模型的加深加巨,CNN的众多拓展模型在众多任务中超越了很多传统技术方法,甚至堪比人类的识别能力,可适用于广泛的行业应用,如智能驾驶、人脸识别等。
[0003]然而,在卷积神经网络如此华丽的外表之下,往往是以牺牲巨大的内存存储,繁多的计算量,冗长的训练时间为代价,这使其在许多资源受限的嵌入式设备和对实时性要求较高的移动端的部署带来了许多阻碍。现如今像城市智能安防,城市交通管理,无人驾驶,人机交互等此类应用场景无一不在运算的实时性方面对网络模型提出了极高的要求。这些应用模型在借助深度卷积神经网络(deep convolutional neural network,DCNN)强大的特征提取和处理能力的同时,也不得不需要面对DCNN为部署平台带来的高昂的存储和计算成本,这也导致这些深度模型虽然己达到了满足任务性能的指标需求,却仍然难以被部署在移动设备或嵌入式平台上运行,限制了其进一步推广。
[0004]为使得复杂的网络模型能更好的应用于移动设备与嵌入式平台中,有些研究学者通过设计新的 ...
【技术保护点】
【技术特征摘要】
1.一种深度卷积神经网络的混合精度量化方法,其特征在于,包括步骤:S11、加载经过样本训练后的全精度深度卷积神经网络模型,获取其输入层、各个卷积层和各个全连接层用浮点数表示的权重与偏置的最大值与最小值;S12、根据输入层、各个卷积层和各个全连接层用浮点数表示的权重和偏置的最大值、最小值以及需要量化的精度,计算出输入层、各个卷积层和各个全连接层的权重与偏置对应的缩放系数和量化零点;S13、根据输入层、各个卷积层和各个全连接层的权重与偏置对应的缩放系数和量化零点,计算出量化后用实数表示的权重与偏置取代原有用浮点数表示的权重与偏置;S14、利用全精度深度卷积神经网络模型的训练数据进行前向传播,得到每层网络的权重与偏置被取代后,全精度深度卷积神经网络模型的每层网络输出浮点数表示的最大值和最小值;S15、根据每层网络输出用浮点数表示的最大值、最小值以及需要量化的精度,计算每层网络输出值对应的缩放系数和量化零点;S16、根据每层网络输出值对应的缩放系数和量化零点,计算出量化后用实数表示的每层网络的输出值取代原有的每层网络用浮点数表示的输出值,完成全精度深度卷积神经网络模型量化框架的搭建;S17、对搭建好的深度卷积神经网络量化框架设置不同的精度组合进行模型测试,从测试准确率结果中选出最佳的量化精度组合。2.如权利要求1所述的深度卷积神经网络的混合精度量化方法,其特征在于,步骤S17具体包括,S171、将搭建好的深度卷积神经网络量化框架中的所有网络层量化精度设置为8比特,记录下准确率结果,随后选择其中一层网络层的量化精度从8比特遍历到1比特,而其他网络层的量化精度保持8比特不变进行模型测试,记录量化后的深度卷积神经网络模型的各网络层的量化精度及对应的测试准确率结果,直到所有网络层的量化精度都从8比特到1比特遍历,记录下各网络层的量化精度及对应的测试准确率结果;S172、对所有的测试准确率结果进行排序;S173、根据模型需要压缩的程度,从排好序的测试准确率结果中选择一个作为阈值,并从每一层网络层的量化精度从8比特下降到1比特过程中所得到的8个测试准确率结果当中找到最接近该阈值所对应的比特位,以确定一组最佳的量化精度组合。3.如权利要求2所述的深度卷积神经网络的混合精度量化方法,其特征在于,在步骤S172中,在对所有的测试准确率结果进行排序之前还包括,对测试准确率结果进行筛选,将采用较高量化精度但测试准确率结果却不如较低量化精度的测试准确率结果删除。4.如权利要求1所述的深度卷积神经网络的混合精度量化方法,其特征在于,步骤S12中,计算缩放系数采用的公式为:计算量化零点采用的公式为:
其中,Z代表量化后的零点;S代表量化的缩放系数;r
max
和r
min
表示浮点数的最大值和最小值;q
max
和q
...
【专利技术属性】
技术研发人员:孙维泽,熊旭伦,黄磊,陈少武,陈贵童,
申请(专利权)人:深圳大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。