一种面向近似神经网络重训练的乘法器及其重训练算法制造技术

技术编号：37483272 阅读：19 留言：0更新日期：2023-05-07 09:23

本发明专利技术提供一种面向近似神经网络重训练的乘法器及其重训练算法，其中乘法器包括多个近似Booth编码模块、多个部分积产生模块和加法器；每个所述近似Booth编码模块接收权重输入中对应位置的多比特数据，并对多比特数据进行编码；每个所述部分积产生模块接收相应所述近似Booth编码模块输出的多比特数据编码结果，并将多比特数据编码结果与特征图数据进行操作得到部分积；所述加法器将所有部分积累加，得到最终输出结果。本发明专利技术通过使用高基数Booth编码以减少部分积数目，并且在近似Booth编码和部分积产生模块引入近似，从而减小乘法器的面积和能耗开销。器的面积和能耗开销。器的面积和能耗开销。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向近似神经网络重训练的乘法器及其重训练算法

[0001]本专利技术属于近似计算和数字运算器件
，尤其涉及一种面向近似神经网络重训练的乘法器及其重训练算法。

技术介绍

[0002]卷积神经网络CNN如今已经被广泛地应用于如图像分类、目标检测等计算机视觉任务中。许多边缘硬件设备如智能摄像头，需要在边缘侧对拍摄的图片进行实时处理，以完成如人脸识别、车辆检测等任务。然而，边缘侧严格的面积和能耗限制给神经网络加速硬件的设计和实现带来了巨大挑战。近似计算就是针对此问题的重要解决方法。
[0003]近似计算利用数字信号处理、神经网络等应用固有的容错性，通过在运算器件中引入一定的误差，减小硬件的面积和能耗，同时使得应用性能的下降在允许范围内。在神经网络中，乘法运算的使用率、能耗最高，同时乘法器的面积也远大于加法器等其他运算器件，因此设计合适的近似乘法器以替换精确乘法器能够使得加速硬件更好地匹配于边缘侧场景。
[0004]用近似乘法器直接替换精确乘法器，会造成神经网络准确率的大幅下降，尤其是对于复杂任务。通过模拟近似乘法器的运算行为进行重训练，可以补偿由近似乘法器引起的精度下降。然而，由于乘法运算过程中会引入无规律的错误(例如部分积的生成和部分积的累加)，因此只能在训练中通过查找表模拟并且很难用GPU加速。因此，目前使用的重训练方法的设计局限于较小的网络和相对简单的任务。为了避免重训练的困难，一些现有的工作从分析CNN中每一层的容错性开始，然后为每一层分配不同的近似乘法器，甚至在一些关键层使用精确乘法器，以...

【技术保护点】

【技术特征摘要】
1.一种面向近似神经网络重训练的乘法器，其特征在于，包括多个近似Booth编码模块、多个部分积产生模块和加法器；每个所述近似Booth编码模块接收权重输入中对应位置的多比特数据，并对多比特数据进行编码；每个所述部分积产生模块接收相应所述近似Booth编码模块输出的多比特数据编码结果，并将多比特数据编码结果与特征图数据进行操作得到部分积；所述加法器将所有部分积累加，得到最终输出结果。2.根据权利要求1所述的面向近似神经网络重训练的乘法器，其特征在于，采用多个高基数Booth编码以减少所述部分积的数目。3.根据权利要求2所述的面向近似神经网络重训练的乘法器，其特征在于，所述采用多个高基数Booth编码以减少所述部分积的数目，包括：从权重输入尾部开始依次进行基
‑
8Booth编码；如果编码至权重输入头部时需要进行符号位扩展才可进行基
‑
8Booth编码，则对头部采用比基
‑
8Booth编码更低基数进行编码。4.根据权利要求3所述的面向近似神经网络重训练的乘法器，其特征在于，所述每个近似Booth编码模块将基
‑
8Booth编码真值表中编码结果为+3或
‑
3的全部置为0；去除了+3和
‑
3的编码结果后，其余编码结果在每个所述部分积产生模块中与特征图输入的乘积均通过移位产生。5.根据权利要...

【专利技术属性】
技术研发人员：刘伟强，余天洋，吴比，
申请(专利权)人：南京航空航天大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人