System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于查找表逻辑的数据量化激活方法、装置、设备与介质制造方法及图纸_技高网

基于查找表逻辑的数据量化激活方法、装置、设备与介质制造方法及图纸

技术编号:42435232 阅读:7 留言:0更新日期:2024-08-16 16:45
本申请涉及基于查找表逻辑的数据量化激活方法、装置、设备与介质,该方法通过针对U8量化场景设计了基于查找表逻辑的数据量化激活装置,当神经网络的当前层需要对上一层卷积输出的特征进行处理时,装置将被调用并可快速从外部存储设备中获取该当前层所需的查找表及已经转为U8数据类型的上一层卷积输出的特征描述数据,然后由选择器根据卷积结果查找表中,取出对应于该特征描述数据的激活计算与量化后的U8结果,从而直接通过查表的方式获得该当前层的输出结果,实现将反量化、激活和量化三个计算步骤合的快速计算输出,实现了更低功耗、更低成本与更快速度的计算,有效提高了量化激活加速性能。

【技术实现步骤摘要】

本专利技术属于计算机人工智能,涉及一种基于查找表逻辑的数据量化激活方法、装置、设备与介质


技术介绍

1、随着人工智能技术的不断发展和应用,各种联网智能终端(如机器人、智能汽车和物流终端等)对其自身的图像数据计算能力的要求也越来越高。其中,激活函数是神经网络中一个非常重要的组成部分,它主要有以下几个作用:引入非线性,线性模型只能学习线性关系,而激活函数可以将线性关系转换为非线性关系,从而使神经网络能够学习更复杂的数据模式。加速梯度下降,激活函数可以使梯度下降算法更容易找到最优解。防止梯度消失,在深度神经网络中,如果使用的是线性激活函数,那么梯度会随着网络层数的增加而不断减小,最终导致梯度消失。而激活函数可以防止梯度消失。在神经网络的激活加速中,传统技术有的是基于浮点运算实现量化激活加速,也有的是使用查找表进行量化激活加速,然而,专利技术人在实现本专利技术的过程中发现传统技术仍存在着量化加速性能不足的技术问题。


技术实现思路

1、针对上述传统方法中存在的问题,本专利技术提出了一种基于查找表逻辑的数据量化激活方法、一种基于查找表逻辑的数据量化激活装置、一种ai加速设备以及一种计算机可读存储介质,能够有效提高量化激活加速性能。

2、为了实现上述目的,本专利技术实施例采用以下技术方案:

3、一方面,提供一种基于查找表逻辑的数据量化激活方法,应用于一种基于查找表逻辑的数据量化激活装置,装置包括通信连接的选择器和寄存器组,选择器用于通过输入线连接外部存储设备,寄存器组用于通过输出线连接外部存储设备,寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,查找表通过基于u8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

4、数据量化激活方法包括步骤:

5、从外部存储设备中获取当前层所需使用的查找表并载入寄存器组;

6、从外部存储设备中获取神经网络上一层卷积输出的特征描述数据,并通过输入线输入至选择器;特征描述数据为u8数据类型的数据结果;

7、通过选择器根据特征描述数据到寄存器组中的查找表中进行查表,得到对应特征描述数据的激活计算与量化后的u8结果;

8、将u8结果通过输出线写回到外部存储设备中。

9、在其中一个实施例中,上述的基于查找表逻辑的数据量化激活方法还包括步骤:

10、利用神经网络对多张输入图像进行推理,分别获取每个神经网络层对应输出的特征描述数据的取值范围;

11、基于取值范围的最大值和最小值,利用浮点计算获取基于浮点的激活结果的最大值和最小值,获取每个神经网络层对应输出的特征描述数据的激活计算与量化的结果;

12、分别将每个神经网络层对应的取值范围进行u8量化,得到每个神经网络层对应的256种状态的映射关系。

13、另一方面,还提供一种基于查找表逻辑的数据量化激活装置,包括通信连接的选择器和寄存器组,选择器用于通过输入线连接外部存储设备,寄存器组用于通过输出线连接外部存储设备;寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,查找表通过基于u8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

14、当数据量化激活装置被触发时,外部存储设备中将当前层所需使用的查找表载入寄存器组;选择器通过输入线从外部存储设备中获取神经网络上一层卷积输出的特征描述数据后,根据特征描述数据到寄存器组中的查找表中进行查表,得到对应特征描述数据的激活计算与量化后的u8结果,寄存器组通过输出线将u8结果写回到外部存储设备中;特征描述数据为u8数据类型的数据结果。

15、又一方面,还提供一种ai加速设备,包括ai算力芯片,ai算力芯片上部署有一种基于查找表逻辑的数据量化激活装置,数据量化激活装置包括通信连接的选择器和寄存器组,选择器用于通过输入线连接外部存储设备,寄存器组用于通过输出线连接外部存储设备;寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,查找表通过基于u8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

16、当数据量化激活装置被触发时,外部存储设备中将当前层所需使用的查找表载入寄存器组;选择器通过输入线从外部存储设备中获取神经网络上一层卷积输出的特征描述数据后,根据特征描述数据到寄存器组中的查找表中进行查表,得到对应特征描述数据的激活计算与量化后的u8结果,寄存器组通过输出线将u8结果写回到外部存储设备中;特征描述数据为u8数据类型的数据结果。

17、再一方面,还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述的基于查找表逻辑的数据量化激活方法的步骤。

18、上述技术方案中的一个技术方案具有如下优点和有益效果:

19、上述基于查找表逻辑的数据量化激活方法、装置、设备与介质,通过针对u8量化场景预先设计了由选择器以及256个8位寄存器构成的寄存器组组成的基于查找表逻辑的数据量化激活装置,将其应用于神经网络的量化激活计算操作中,当神经网络的当前层需要对上一层卷积输出的特征进行处理时,该基于查找表逻辑的数据量化激活装置将被调用并可通过配置文件传递的方式,快速从外部存储设备中获取该当前层所需的查找表及已经转为u8数据类型的上一层卷积输出的特征描述数据,然后由选择器根据卷积结果查找表中,取出对应于该特征描述数据的激活计算与量化后的结果(该结果同样为u8数据类型的特征),从而直接通过查表的方式获得该当前层的输出结果,实现将反量化、激活和量化三个计算步骤合的快速计算输出。

20、相比于传统技术,采用了针对u8量化场景设计的基于查找表逻辑的数据量化激活装置进行查表输出,将反量化、激活和量化三个步骤合并,实现了u8数据基于查找表实现激活与量化,直接输出激活计算与量化后的u8结果。提高了数据处理效率的同时,降低了计算要求,也使得硬件装置的结构及其计算过程得到了简化明显,实现了更低功耗、更低成本与更快速度的计算;此外,硬件装置应用于图像数据处理芯片内还能有效降低io接口数量,最终有效提高了量化激活加速性能。

本文档来自技高网...

【技术保护点】

1.一种基于查找表逻辑的数据量化激活方法,其特征在于,应用于一种基于查找表逻辑的数据量化激活装置,所述装置包括通信连接的选择器和寄存器组,所述选择器用于通过输入线连接外部存储设备,所述寄存器组用于通过输出线连接所述外部存储设备,所述寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,所述查找表通过基于U8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

2.根据权利要求1所述的基于查找表逻辑的数据量化激活方法,其特征在于,所述方法还包括步骤:

3.一种基于查找表逻辑的数据量化激活装置,其特征在于,包括通信连接的选择器和寄存器组,所述选择器用于通过输入线连接外部存储设备,所述寄存器组用于通过输出线连接所述外部存储设备;所述寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,所述查找表通过基于U8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

4.一种AI加速设备,其特征在于,包括AI算力芯片,所述AI算力芯片上部署有一种基于查找表逻辑的数据量化激活装置,所述数据量化激活装置包括通信连接的选择器和寄存器组,所述选择器用于通过输入线连接外部存储设备,所述寄存器组用于通过输出线连接所述外部存储设备;所述寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,所述查找表通过基于U8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

5.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现权利要求1或2所述的基于查找表逻辑的数据量化激活方法的步骤。

...

【技术特征摘要】

1.一种基于查找表逻辑的数据量化激活方法,其特征在于,应用于一种基于查找表逻辑的数据量化激活装置,所述装置包括通信连接的选择器和寄存器组,所述选择器用于通过输入线连接外部存储设备,所述寄存器组用于通过输出线连接所述外部存储设备,所述寄存器组由256个8位寄存器构成并用于存储预先生成的查找表,所述查找表通过基于u8量化预先对多张图像进行推理后,利用获取的各图像的卷积结果与激活后量化的结果之间的映射关系构建得到;

2.根据权利要求1所述的基于查找表逻辑的数据量化激活方法,其特征在于,所述方法还包括步骤:

3.一种基于查找表逻辑的数据量化激活装置,其特征在于,包括通信连接的选择器和寄存器组,所述选择器用于通过输入线连接外部存储设备,所述寄存器组用于通过输出线连接所述外部存储设备;所述寄存器组由256个8位寄存器构成并用于存储预...

【专利技术属性】
技术研发人员:龚国辉许骄隋强吴湘笛曾喜芳
申请(专利权)人:湖南长城银河科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1