稀疏加速单元、计算方法及稀疏神经网络硬件加速系统技术方案

技术编号：37704460 阅读：31 留言：0更新日期：2023-06-01 23:52

本发明专利技术公开了一种稀疏加速单元、计算方法及稀疏神经网络硬件加速系统。所述稀疏加速单元，包括N个计算单元和i级稀疏加法树，所述计算单元为乘法器结构，所述稀疏加法树采用二叉树结构连接，即：上一级稀疏加法树的稀疏加法器数量是下一级的两倍，上一级的每两个稀疏加法器同时连接下一级的一个稀疏加法器；第一级稀疏加法树的稀疏加法器数量为N/2；各级稀疏加法树的稀疏加法器数据位宽依次递增1bit。所述稀疏神经网络硬件加速系统，包括多个所述稀疏加速单元，可兼容多种稀疏神经网络算法模型。本发明专利技术还公开了一种稀疏加速计算方法，基于稀疏加速单元硬件架构解决了稀疏矩阵不规则计算问题，同时在不损失效率下兼容密集型矩阵运算加速。阵运算加速。阵运算加速。

全部详细技术资料下载

【技术实现步骤摘要】
稀疏加速单元、计算方法及稀疏神经网络硬件加速系统

[0001]本专利技术涉及集成电路领域及人工智能领域，具体涉及系统级别的集成电路芯片领域，特别涉及一种稀疏加速单元、计算方法及稀疏神经网络硬件加速系统。

技术介绍

[0002]神经网络已经在图像识别、目标检测、语音识别和自然语言处理等诸多领域受到广泛应用，并逐渐成为主导算法，但是，复杂的人工智能应用通常需要更复杂的更深的神经网络模型，这些模型包含庞大的参数量和运算量。尽管最近的研究进展表明，网络压缩例如模型剪枝已成为减轻计算负担的有效手段，但模型剪枝引起的神经网络连接不规则性，阻止了现有的运算加速器如CPU、GPU、FPGA等充分利用神经网络的稀疏性。此外，大多数现有的运算加速器都聚焦于密集型的深度神经网络，无法高效解决稀疏神经网络模型中不规则的计算问题。

技术实现思路

[0003]为克服现有技术存在的缺陷，本专利技术公开了一种稀疏加速单元、计算方法及稀疏神经网络硬件加速系统。
[0004]本专利技术所述稀疏加速单元，包括N个计算单元和i级稀疏加法树，其中i=log2N, 所述计算单元为乘法器结构，所述稀疏加法树采用二叉树结构连接，即：上一级稀疏加法树的稀疏加法器数量是下一级的两倍，上一级的每两个稀疏加法器同时连接下一级的一个稀疏加法器；第一级稀疏加法树的稀疏加法器数量为N/2；各级稀疏加法树的稀疏加法器数据位宽依次递增1bit；所述稀疏加法器的功能为：若本次输入的两组数据索引相同，则将两个输入数据相加作为输出结果，并将两组数据索引中任意一...

【技术保护点】

【技术特征摘要】
1.稀疏加速单元，其特征在于, 包括N个计算单元和i级稀疏加法树，其中i=log2N,所述计算单元为乘法器结构，所述稀疏加法树采用二叉树结构连接，即：上一级稀疏加法树的稀疏加法器数量是下一级的两倍，上一级的每两个稀疏加法器同时连接下一级的一个稀疏加法器；第一级稀疏加法树的稀疏加法器数量为N/2；各级稀疏加法树的稀疏加法器数据位宽依次递增1bit；所述稀疏加法器的功能为：若本次输入的两组数据索引相同，则将两个输入数据相加作为输出结果，并将两组数据索引中任意一个作为输出索引；否则将数据索引较小的一组输入数据和数据索引作为输出结果，将数据索引较大的一组数据锁存，同时从数据索引较小的一组输入端口载入新的数据进行下一次运算。2.如权利要求1所述稀疏加速单元，其特征在于，所述稀疏加法器包括比较器、加法器和寄存器，比较器和加法器的两个输入端分别连接稀疏加法器的两个输入端，比较器的输出端连接加法器和输出控制器，加法器的输出端连接输出控制器，所述输出控制器连接加法器的输出端、比较器的输出端和稀疏加法器的输出端，并连接寄存器，由输出控制器根据比较器的比较结果进行输出和数据锁存。3.稀疏神经网络硬件加速系统，其特征在于，包括稀疏存储编解码模块和与稀疏存储编解码模块连接的稀疏数据中间处理模块，所述稀疏数据中间处理模块还连接有权重分配模块和移位寄存器单元，所述权重分配模块和移位寄存器单元均连接有多个如权利要求1至2任意一项所述稀疏加速单元，所述稀疏加...

【专利技术属性】
技术研发人员：伍元聪，罗敏，西贝与非，金正权，
申请(专利权)人：成都甄识科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人