【技术实现步骤摘要】
【国外来华专利技术】用于神经网络模型压缩的量化、自适应块分区和码本编解码的方法和装置
[0001]引用并入
[0002]本申请要求于2019年11月22日提交的美国临时专利申请第62/939,057号,2019年11月22日提交的美国临时专利申请第62/939,054号,2019年11月25日提交的美国临时专利申请第62/939,949号,2019年12月12日提交的美国临时专利申请第62/947,236,以及2020年11月16日向美国专利商标局提交的美国专利申请第17/099,202号的优先权。在先申请的全部内容通过引用并入本文。
技术介绍
[0003]深度神经网络(Deep Neural Networks,DNNs)在语义分类、目标检测/识别、目标跟踪、视频质量增强等大量视频应用中取得成功,因此需要压缩DNN模型。因此,运动图像专家组(Motion Picture Experts Group,MPEG)正在积极致力于神经网络标准(Neural Network standard,NNR)的编码表示,该标准用于对DNN模型进行编码以节省存储和计算。
技术实现思路
[0004]根据实施例,一种用于神经网络模型压缩的量化、自适应块分区和码本编码的方法由至少一个处理器执行,并且包括:确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;并且,将所述多维张量中的权重系数限幅在所述饱和最大值的范围内。所述方法还包括基于所述位深度,量化已限幅的权重系数;以及,向解码器发送包括所述位深度的层报头。
[0005]根 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于神经网络模型压缩的量化、自适应块分区和码本编码的方法,其特征在于,所述方法由至少一个处理器执行,并且所述方法包括:确定神经网络的一层中多维张量的饱和最大值,以及对应于所述饱和最大值的位深度;将所述多维张量中的权重系数限幅在所述饱和最大值的范围内;基于所述位深度,量化已限幅的权重系数;以及,向解码器发送包括所述位深度的层报头。2.根据权利要求1所述的方法,其特征在于,进一步包括:使用可变长度编码或固定长度编码,对所述位深度进行编码,其中,所述层报头包括已编码的位深度。3.根据权利要求1所述的方法,其特征在于,所述层报头进一步包括所述饱和最大值。4.根据权利要求1所述的方法,其特征在于,所述饱和最大值由浮点数表示。5.根据权利要求4所述的方法,其特征在于,进一步包括:基于以下等式确定表示所述饱和最大值的整数:int_layer_sat_maxw=int(ceil(layer_sat_maxw*(2**N))),其中,int_layer_sat_maxw指示所述饱和最大值的整数,并且layer_sat_maxw指示所述饱和最大值。6.根据权利要求5所述的方法,其特征在于,进一步包括:使用可变长度编码或固定长度编码,对所述饱和最大值的所述整数进行编码。7.根据权利要求1所述的方法,其特征在于,所述层报头进一步包括所述量化已限幅的权重系数的步长。8.根据权利要求1所述的方法,其特征在于,进一步包括:将已量化的权重系数中的神经网络的四维4D参数张量重塑为所述神经网络的三维3D参数张量,所述3D参数张量包括卷积核大小、输入特征大小和输出特征大小;将所述3D参数张量沿着平面分区为多个3D编码树单元CTU3D,其中,所述平面由所述输入特征大小和所述输出特征大小形成;以及,对所述多个CTU3D进行熵编码。9.根据权利要求8所述的方法,其特征在于,所述CTU3D是不重叠的正方形块。10.根据权利要求8所述的方法,其特征在于,进一步包括:设置一个标志,以指示每个CTU3D都有一个恒定的大小,其中,所述对所述3D参数张量进行分区包括:基于设置为指示所述每个CTU3D都有一个恒定大小的所述标志,将所述3D参数张量沿着所述平面划分为具有所述恒定大小的所述多个CTU3D。11.根据权利要求8所述的方法,其特征在于,进一步包括:设置一个标志,以指示每个CTU3D都有一个基于所述卷积核大小缩放的大小,其中,所述对所述3D参数张量进行分区包括:基于设置为指示所述每个CTU3D都有一个基于所述卷积核大小缩放的大小,将所述3D参数张量沿着所述平面划分为所述多个CTU3D,其中,所述多个CTU3D中每个CTU3D都有一个基于所述卷积核大小缩放的大小。12.根据权利要求8所述的方法,其特征在于,所述对所述多个CTU3D进行熵编码包括:
在水平方向或垂直方向上,以光栅扫描顺序...
【专利技术属性】
技术研发人员:王炜,蒋薇,刘杉,崔秉斗,史蒂芬,
申请(专利权)人:腾讯美国有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。