【技术实现步骤摘要】
一种基于脉动阵列的神经网络加速器卷积计算装置与方法
[0001]本专利技术涉及计算机
,尤其是涉及一种基于脉动阵列的神经网络加速器卷积计算方法。
技术介绍
[0002]随着人工智能的迅速发展,神经网络逐渐变得更深更宽,包含大量的网络层,每一个网络层都存在权重数据和特征图数据之间的卷积操作。再进行卷积操作时,一般会将卷积操作转化成矩阵乘法,而权重数据和特征图数据中包含大量的数据,因此计算量呈现爆炸式增长。
[0003]按照传统的计算系统的模型,提前从memory中读取卷积需要的输入特征图和卷积核权重,进行运算完毕后再将结果写回存储器,继续下一批输入特征图和权重。这种方法简单直接容易计算,但是随着网络深度的增加,其计算时间过长,从而效率偏低,网络的实时性变差。此外,传统方法会占用过多的片上资源,导致芯片的面积增大。
技术实现思路
[0004]为解决现有技术的不足,实现提升数据吞吐率、提高扩展性及简化数据控制的目的,本专利技术采用如下的技术方案:一种基于脉动阵列的神经网络加速器卷积计算装置,包括PE基本运算单元排布而成的脉动阵列,所述脉动阵列最后一行为ACC累加模块,用于存储最终卷积运算结果,所述PE基本运算单元包括权重信息输入接口、特征图信息输入接口、上级PE基本运算单元运算结果输入接口(sum_in)、乘法器、加法器、权重信息输出接口、特征图信息输出接口和运算结果输出接口(sum_out),第一行PE基本运算单元的权重信息输入接口用于获取卷积核权重,第一列PE基本运算单元的特征图信息输入接 ...
【技术保护点】
【技术特征摘要】
1.一种基于脉动阵列的神经网络加速器卷积计算装置,包括运算单元排布而成的脉动阵列,其特征在于所述脉动阵列最后一行为累加模块,用于存储最终运算结果,所述运算单元包括权重信息输入接口、特征图信息输入接口、上级运算单元运算结果输入接口、乘法器、加法器、权重信息输出接口、特征图信息输出接口和运算结果输出接口,第一行运算单元的权重信息输入接口用于获取卷积核权重,第一列运算单元的特征图信息输入接口用于获取特征图数据,单个运算单元内,权重信息输入接口与权重信息输出接口连接,特征图信息输入接口与特征图信息输出接口连接,乘法器分别与权重信息输入接口、特征图信息输入接口和加法器连接,将权重数据与特征图数据相乘的结果作为加法器的输入,加法器分别与上级运算单元运算结果输入接口和运算结果输出接口连接,将上级运算单元运算结果与乘法器的输出累加后输出,运算单元的权重信息输出接口和运算结果输出接口,分别与同一列下一行的运算单元的权重信息输入接口、上级运算单元运算结果输入接口连接,运算单元的特征图信息输出接口与同一行下一列的运算单元的特征图信息输入接口连接,每一列的相邻运算单元及每一行的相邻运算单元之间,通过寄存器连接,寄存器在时钟信号的控制下,进行数据的存储和传递,最后一行运算单元的运算结果输出接口与其对应的累加模块连接。2.根据权利要求1所述的一种基于脉动阵列的神经网络加速器卷积计算装置,其特征在于所述权重信息输入接口包括权重输入接口、权重有效信号输入接口,所述特征图信息输入接口包括特征图数据输入接口、特征图数据有效信号输入接口,所述权重信息输出接口包括权重输出接口、权重有效信号寄存输出接口,所述特征图信息输出接口包括特征图数据寄存输出接口、特征图数据有效信号寄存输出接口,权重输入接口分别与权重输出接口和乘法器连接,权重有效信号输入接口分别与权重有效信号寄存输出接口和乘法器连接,特征图数据输入接口分别与特征图数据寄存输出接口和乘法器连接,特征图数据有效信号输入接口分别与特征图数据有效信号寄存输出接口和乘法器连接。3.根据权利要求2所述的一种基于脉动阵列的神经网络加速器卷积计算装置,其特征在于所述运算单元包括权重寄存器、权重有效信号寄存器、特征图数据寄存器、特征图数据有效信号寄存器和上级运算单元运算结果寄存器,权重寄存器分别与权重输入接口、权重有效信号输入接口和乘法器连接,权重有效信号寄存器分别与权重有效信号输入接口和权重有效信号寄存输出接口连接,特征图数据寄存器分别与特征图数据输入接口、特征图数据有效信号输入接口和乘法器连接,特征图数据有效信号寄存器分别与特征图数据有效信号输入接口和特征图数据有效信号寄存输出接口连接,上级运算单元运算结果寄存器分别与上级运算单元运算结果输入接口和运算结果输出接口连接。4.根据权利要求1所述的一种基于脉动阵列的神经网络加速器卷积计算装置,其特征在于所述脉动阵列为X
×
X个运算单元构成的阵列。5.根据权利要求1所述的一种基于脉动阵列的神经网络加速器卷积计算装置,其特征在于所述累加模块,包括上级运算单元计算结果输入接口、累加完成信号输入接口、累加使能信号输入接口、读写地址信号输入接口、累加结果输出接口、累加器、第一选择器、第二选择器和缓存器,上级运算单元计算结果输入接口通过累加器与第一选择器连接,第一选择器分别与累加完成信号输入接口、第二选择器和缓存器连接,第二选择器分别与上级运算单元计算结果输入接口、累加使能信号输入接口和累加结果输出接口连接,缓存器分别与
...
【专利技术属性】
技术研发人员:杨方超,胡有能,朱国权,凡军海,陆启明,金孝飞,孙世春,章明,何煜坤,潘鑫,马德,
申请(专利权)人:浙江大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。