【技术实现步骤摘要】
【国外来华专利技术】用于神经网络的压缩表示的高级语法
[0001]示例和非限制性实施例总体上涉及多媒体传输和神经网络,更具体地,涉及用于神经网络的压缩表示的高级语法。
技术介绍
[0002]已知为神经网络的交换提供标准化格式。
技术实现思路
[0003]根据一方面,一种装备,包括用于对用于至少一个神经网络的高级比特流语法进行编码或解码的装置;其中,所述高级比特流语法包括至少一个信息单元,所述信息单元具有元数据或所述至少一个神经网络的一部分的压缩的神经网络数据;并且其中,串行化比特流包括所述至少一个信息单元中的一个或多个信息单元。
[0004]根据一个方面,一种装备,包括至少一个处理器;以及至少一个包括计算机程序代码的非暂时性存储器;其中,所述至少一个存储器和所述计算机程序代码被配置为与所述至少一个处理器一起使所述装备至少执行:对用于至少一个神经网络的高级比特流语法进行编码或解码;其中,所述高级比特流语法包括至少一个信息单元,所述信息单元具有元数据或所述至少一个神经网络的一部分的压缩的神经网络数据;并且其中,串行化比特流包括所述至少一个信息单元中的一个或多个信息单元。
[0005]根据一方面,一种方法,包括对用于至少一个神经网络的高级比特流语法进行编码或解码;其中,所述高级比特流语法包括至少一个信息单元,所述信息单元具有元数据或所述至少一个神经网络的一部分的压缩的神经网络数据;并且其中,串行化比特流包括所述至少一个信息单元中的一个或多个信息单元。
[0006]根据一个方面,提供了一种机器可读的非暂时 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种装备,包括:用于对用于至少一个神经网络的高级比特流语法进行编码或解码的装置;其中,所述高级比特流语法包括至少一个信息单元,所述信息单元具有元数据或所述至少一个神经网络的一部分的压缩的神经网络数据;以及其中,串行化比特流包括所述至少一个信息单元中的一个或多个信息单元。2.根据权利要求1所述的装备,其中,所述串行化比特流作为文件被存储在虚拟或非虚拟目录树结构中,或者作为比特流通过数据管道被发送。3.根据权利要求1至2中任一项所述的装备,其中,所述至少一个神经网络的所述一部分是以下中的至少一个:层,滤波器,内核,偏差,量化权重,张量,或至少一个神经网络的可识别部分的任何其他数据结构。4.根据权利要求1至3中任一项所述的装备,其中,所述信息单元包括:信号传送所述信息单元的大小的单元大小;携带与所述至少一个神经网络相关的压缩或未压缩数据以及相关元数据的单元有效负载;以及具有关于所述单元有效负载携带的数据类型的信息和相关元数据的单元头部。5.根据权利要求4所述的装备,其中,所述单元有效负载包括以下至少一项:包括全局元数据和关于所述至少一个神经网络的信息的参数集合;神经网络拓扑信息和相关数据;压缩的或未压缩的神经网络数据,其为完整的或部分的;量化数据;或压缩的神经网络比特流开始指示符或与开始码相关的有效负载数据。6.根据权利要求5所述的装备,其中,所述拓扑数据、所述压缩的或未压缩的神经网络数据单元有效负载、或所述量化数据中的至少一个被分割为多个信息单元。7.根据权利要求6所述的装备,其中,神经网络单元头部包括用于指示所述分割的信息。8.根据权利要求7所述的装备,其中,指示所述分割的所述信息由向后计数以便指示使用的分割的数量的计数器表示。9.根据权利要求7至8中任一项所述的装备,其中,计数器值0指示没有部分信息,并且大于0的所述计数器值指示所述部分信息的索引。10.根据权利要求6至9中任一项所述的装备,其中,所述多个信息单元在它们各自的单元头部中具有相同的唯一标识符,以指示分割所属的神经网络拓扑元素级别信息。11.根据权利要求10所述的装备,其中,所述唯一标识符是NNEF拓扑图中的Khronos神经网络交换格式NNEF变量标识符或标签。12.根据权利要求6至11中任一项所述的装备,其中,所述拓扑信息包括Khronos神经网络交换格式NNEF拓扑信息。13.根据权利要求6至12中任一项所述的装备,其中,所述多个信息单元在它们的单元头部中具有指示这样的信息单元是否是可独立解码的标志。14.根据权利要求5至13中任一项所述的装备,其中,所述参数集合包含指示在所述压缩的神经网络比特流中拓扑单元的存在和携带的标志。
15.根据权利要求5至14中任一项所述的装备,其中,所述参数集合包含指示是否将稀疏化被应用于所述至少一个神经网络的标志。16.根据权利要求5至15中任一项所述的装备,其中,所述参数集合包含稀疏化性能图数据结构,所述稀疏化性能图数据结构信号传送在不同稀疏化阈值与所得到的神经网络推理准确性之间的映射。17.根据权利要求16所述的装备,其中,所述得到的神经网络推理准确性对应于所述至少一个神经网络在输出准确性方面的性能。18.根据权利要求5至17中任一项所述的装备,其中,单元有效负载或头部包含量化映射数据结构,所述量化映射数据结构信号传送码本,所述码本包括在量化值和对应的去量化值之间的映射。19.根据权利要求1至18中任一项所述的装备,其中,使用神经网络交换格式来携带所述压缩的神经网络数据。20.根据权利要求5至19中任一项所述的装备,其中,所述压缩的神经网络数据单元有效负载是经由与所述压缩的网络数据单元有效负载相关联的单元头部内的引用或标签可映射到所述拓扑数据的,其中所述引用或标签包括以下中的至少一个:唯一标识符,唯一字符串,或相对或绝对的统一资源标识符或定位符。21.根据权利要求4至20中任一项所述的装备,其中,所述单元头部指示神经网络单元类型,所述神经网络单元类型指示所述串行化比特流的开始,其中所述串行化比特流是压缩的或未压缩的神经网络比特流。22.根据权利要求1至21中任一项所述的装备,其中,编码器通过传输信道向解码器提供所述串行化比特流。23.根据权利要求1至22中任一项所述的装备,其中,所述高级语法的所述解码包括:通过读取至少一个信息单元的大小、与所述信息单元相关联的单元头部,以及与所述信息单元相关联的有效负载,来解析所述单元;以及识别和解析与所述信息单元相关联的拓扑数据、量化数据、开始码指示符数据、参数集合数据、或压缩或未压缩数据中的至少一个。24.根据权利要求23所述的装备,还包括:用于检查开始单元的存在的装置,所述开始单元指示所述比特流的所述开始和在所述比特流的所述开始处所述解码的开始。25.根据权利要求23至24中任一项所述的装备,还包括:用于进一步压缩与所述信息单元相关联的压缩数据的装置。26.一种方法,包括:对用于至少一个神经网络的高级比特流语法进行编码或解码;其中,所述高级比特流语法包括至少一个信息单元,所述信息单元具有元数据或所述至少一个神经网络的一部分的压缩的神经网络数据;以及...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。