用于神经网络模型压缩的量化、自适应块分区和码本编解码的方法和装置制造方法及图纸

技术编号：31373076 阅读：20 留言：0更新日期：2021-12-15 10:52

一种用于神经网络模型压缩的量化、自适应块分区和码本编码的方法由至少一个处理器执行，并且包括：确定神经网络的一层中多维张量的饱和最大值，以及对应于所述饱和最大值的位深度；并且，将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。所述方法还包括基于所述位深度，量化已限幅的权重系数；以及，向解码器发送包括所述位深度的层报头。解码器发送包括所述位深度的层报头。解码器发送包括所述位深度的层报头。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于神经网络模型压缩的量化、自适应块分区和码本编解码的方法和装置
[0001]引用并入
[0002]本申请要求于2019年11月22日提交的美国临时专利申请第62/939,057号，2019年11月22日提交的美国临时专利申请第62/939,054号，2019年11月25日提交的美国临时专利申请第62/939,949号，2019年12月12日提交的美国临时专利申请第62/947,236，以及2020年11月16日向美国专利商标局提交的美国专利申请第17/099,202号的优先权。在先申请的全部内容通过引用并入本文。

技术介绍

[0003]深度神经网络(Deep Neural Networks，DNNs)在语义分类、目标检测/识别、目标跟踪、视频质量增强等大量视频应用中取得成功，因此需要压缩DNN模型。因此，运动图像专家组(Motion Picture Experts Group，MPEG)正在积极致力于神经网络标准(Neural Network standard，NNR)的编码表示，该标准用于对DNN模型进行编码以节省存储和计算。

技术实现思路

[0004]根据实施例，一种用于神经网络模型压缩的量化、自适应块分区和码本编码的方法由至少一个处理器执行，并且包括：确定神经网络的一层中多维张量的饱和最大值，以及对应于所述饱和最大值的位深度；并且，将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。所述方法还包括基于所述位深度，量化已限幅的权重系数；以及，向解码器发送包括所述位深度的层报头。
[0005]根...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于神经网络模型压缩的量化、自适应块分区和码本编码的方法，其特征在于，所述方法由至少一个处理器执行，并且所述方法包括：确定神经网络的一层中多维张量的饱和最大值，以及对应于所述饱和最大值的位深度；将所述多维张量中的权重系数限幅在所述饱和最大值的范围内；基于所述位深度，量化已限幅的权重系数；以及，向解码器发送包括所述位深度的层报头。2.根据权利要求1所述的方法，其特征在于，进一步包括：使用可变长度编码或固定长度编码，对所述位深度进行编码，其中，所述层报头包括已编码的位深度。3.根据权利要求1所述的方法，其特征在于，所述层报头进一步包括所述饱和最大值。4.根据权利要求1所述的方法，其特征在于，所述饱和最大值由浮点数表示。5.根据权利要求4所述的方法，其特征在于，进一步包括：基于以下等式确定表示所述饱和最大值的整数：int_layer_sat_maxw＝int(ceil(layer_sat_maxw*(2**N))),其中，int_layer_sat_maxw指示所述饱和最大值的整数，并且layer_sat_maxw指示所述饱和最大值。6.根据权利要求5所述的方法，其特征在于，进一步包括：使用可变长度编码或固定长度编码，对所述饱和最大值的所述整数进行编码。7.根据权利要求1所述的方法，其特征在于，所述层报头进一步包括所述量化已限幅的权重系数的步长。8.根据权利要求1所述的方法，其特征在于，进一步包括：将已量化的权重系数中的神经网络的四维4D参数张量重塑为所述神经网络的三维3D参数张量，所述3D参数张量包括卷积核大小、输入特征大小和输出特征大小；将所述3D参数张量沿着平面分区为多个3D编码树单元CTU3D，其中，所述平面由所述输入特征大小和所述输出特征大小形成；以及，对所述多个CTU3D进行熵编码。9.根据权利要求8所述的方法，其特征在于，所述CTU3D是不重叠的正方形块。10.根据权利要求8所述的方法，其特征在于，进一步包括：设置一个标志，以指示每个CTU3D都有一个恒定的大小，其中，所述对所述3D参数张量进行分区包括：基于设置为指示所述每个CTU3D都有一个恒定大小的所述标志，将所述3D参数张量沿着所述平面划分为具有所述恒定大小的所述多个CTU3D。11.根据权利要求8所述的方法，其特征在于，进一步包括：设置一个标志，以指示每个CTU3D都有一个基于所述卷积核大小缩放的大小，其中，所述对所述3D参数张量进行分区包括：基于设置为指示所述每个CTU3D都有一个基于所述卷积核大小缩放的大小，将所述3D参数张量沿着所述平面划分为所述多个CTU3D，其中，所述多个CTU3D中每个CTU3D都有一个基于所述卷积核大小缩放的大小。12.根据权利要求8所述的方法，其特征在于，所述对所述多个CTU3D进行熵编码包括：
在水平方向或垂直方向上，以光栅扫描顺序...

【专利技术属性】
技术研发人员：王炜，蒋薇，刘杉，崔秉斗，史蒂芬，
申请(专利权)人：腾讯美国有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人