一种神经网络加速器的通用计算电路制造技术

技术编号：23363735 阅读：20 留言：0更新日期：2020-02-18 17:35

本发明专利技术公开了一种神经网路加速器的通用计算模块电路，是由m个通用计算模块PE组成，任意第i个通用计算模块PE是由RAM、2

A general computing circuit of neural network accelerator

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络加速器的通用计算电路
本专利技术属于集成电路的现场可编程门阵列(FieldProgrammableGateArray，FPGA)设计
，具体的说是神经网络加速器的通用计算模块电路。
技术介绍
2012年，AlexNet夺得大规模视觉识别挑战的冠军，深度神经网络重新成为研究热点，其中对卷积神经网络的研究受到越来越多的关注，己被广泛应用于数字视频监控，人脸识别，图像分类等领域。卷积神经网络的学习过程会用到大量的迭代运算和数据读取，CPU因为内核数目有限，无法充分利用神经网络内部存在的并行性特点。为了提高卷积神经网络的计算速度，目前研究者已经提出了基于GPU，FPGA和ASIC的卷积神经网络硬件架构，其中基于GPU的开发已经在众多的领域广泛应用。在这些平台中，FPGA作为一种计算密集型的器件，芯片上提供了许多专用的算术计算单元、逻辑模块资源和片内的存储资源，使得卷积神经网络的各个计算单元可以在FPGA上并行执行，因此FPGA很适合作为卷积神经网络的硬件加速器。另一方面，FPGA具有灵活性和高效性的特点，芯片的功耗比GPU低得多，而芯片体积较小和成本相对ASIC芯片更低，可以非常方便地应用到各个需要随时进行在线图像或声音处理的电子产品中，比如金融预测、人工智能机器人、医疗诊断等，而且FPGA编程灵活，易于产品升级和维护，产品的设计周期和上市时间都相对较短。卷积神经网络在FPGA平台的加速研究仍然处于起步阶段，没有在各个商业领域得到广泛应用；虽然目前的FPGA平台能够实现卷积神经网络开发，但是平台也存...

【技术保护点】
1.一种神经网络加速器的通用计算电路，其特征是由m个通用计算模块PE组成，任意第i个通用计算模块PE是由RAM、2

【技术特征摘要】
1.一种神经网络加速器的通用计算电路，其特征是由m个通用计算模块PE组成，任意第i个通用计算模块PE是由RAM、2n个乘法器、加法器树、级联加法器、偏置加法器以及先入先出队列和ReLu激活函数模块组成；
在当前周期下，2n个乘法器从所述RAM中获取所存储的权重数据，并接收外部输入的计算数据并进行处理，得到当前周期下的2n个乘积后传递给所述加法器树；
所述加法器树对当前周期下的2n个乘积进行累加处理，得到当前周期下的累加和后存入所述先入先出队列中；
所述先入先出队列将当前周期下的累加和读取并传给所述级联加法器；
所述级联加法器接收当前周期下的累加和，并与不同配置下的级联输入进行计算，得到当前周期下的第i个级联加法器的级联输出；
所述偏置加法器接收当前周期下的第i个级联加法器的级联输出，并与当前周期下外部输入的偏置数据进行计算，得到加法结果后传递给所述ReLu激活函数模块；
由所述ReLu激活函数模块对所述加法结果进行处理，得到当前周期下第i个通用计算模块PE的输出结果以及不同配置下的通用计算电路的输出结果。

2.根据权利要求1所述的神经网路加速器的通用计算电路，其特征是，所述不同配置是按如下步骤进行：
步骤1、判断神经网络中卷积核的尺寸是否小于乘法器的个数2n，若是，则执行单PE卷积配置；否则，执行级联PE卷积配置；
步骤2、判断神经网络中全连接层的输入特征图数量是否小于乘法器的个数2n，若是，则执行单PE全连接配置，否则执行级联PE全连接配置。

...

【专利技术属性】
技术研发人员：杜高明，任宇翔，曹红芳，张多利，田超，宋宇鲲，李桢旻，
申请(专利权)人：合肥工业大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人