【技术实现步骤摘要】
【国外来华专利技术】具有深度学习加速器和随机存取存储器的芯片上系统
[0001]相关申请案
[0002]本申请案要求2020年4月9日提交且名称为“具有深度学习加速器和随机存取存储器的芯片上系统(SYSTEM ON A CHIP WITH DEEP LEARNING ACCELERATOR AND RANDOM ACCESS MEMORY)”的第16/845,002号美国专利申请案的优先权,所述美国专利申请案的全部公开内容特此以引用的方式并入本文中。
[0003]本文公开的至少一些实施例大体上涉及集成电路装置,且更具体地但不限于具有用于人工神经网络(ANN)的加速器的集成电路装置,所述ANN例如是通过机器学习和/或深度学习配置的ANN。
技术介绍
[0004]人工神经网络(ANN)使用神经元网络来处理到所述网络的输入,且产生从所述网络的输出。
[0005]举例来说,网络中的每一神经元接收一组输入。到神经元的输入中的一些可以是网络中的某些神经元的输出;且到神经元的输入中的一些可以是提供到神经网络的输入。网络中的神经元当中的输入/输出关系表示网络中的神经元连接性。
[0006]举例来说,每一神经元可分别针对其输入具有偏置、激活函数和一组突触权重。激活函数可以呈阶跃函数、线性函数、对数S型(log
‑
sigmoid)函数等形式。网络中的不同神经元可以具有不同激活函数。
[0007]举例来说,每一神经元可产生其输入与其偏置的加权和,且接着产生作为加权和的函数的输出,所述输出是使用神经元的 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种装置,其包括:集成电路封装,其包括衬底且围封所述装置;中央处理单元,其配置于所述衬底上;至少一个处理单元,其配置于所述衬底上且经配置以执行具有矩阵操作数的指令;随机存取存储器,其经由所述衬底耦合到所述至少一个处理单元和所述中央处理单元且经配置以存储:人工神经网络的矩阵;能够由所述至少一个处理单元执行以实施所述人工神经网络的指令;以及至少一个应用程序,其经编程以供所述中央处理单元执行;以及接口,其经由所述衬底耦合到所述中央处理单元和所述随机存取存储器且能够耦合到所述装置外部的总线。2.根据权利要求1所述的装置,其进一步包括:中介层,其附连到所述衬底,其中所述中央处理单元经由所述中介层耦合到所述至少一个处理单元或所述随机存取存储器或这两者。3.根据权利要求1所述的装置,其中所述至少一个处理单元经配置以在所述随机存取存储器中存储来自所述人工神经网络的输出作为对所述应用程序的输入;且所述中央处理单元包含存储器控制器,所述存储器控制器经配置以将在所述应用程序的执行期间分配的逻辑存储器映射到所述随机存取存储器中的物理存储器。4.根据权利要求3所述的装置,其中所述存储器控制器经配置以通过所述中央处理单元与所述随机存取存储器之间的第一连接从随机存取存储器加载第一指令以供所述至少一个处理单元执行。5.根据权利要求4所述的装置,其中所述至少一个处理单元经配置以通过到所述随机存取存储器的第二连接从所述随机存取存储器加载矩阵操作数。6.根据权利要求4所述的装置,其中所述中央处理单元包含至少一个算术逻辑单元(ALU);且所述存储器控制器经配置以通过所述中央处理单元与所述随机存取存储器之间的所述第一连接从随机存取存储器加载第二指令以供所述至少一个ALU执行。7.根据权利要求1所述的装置,其进一步包括:第一集成电路裸片,其上配置有深度学习加速器,所述深度学习加速器具有所述至少一个处理单元、控制单元、经配置以存储矩阵操作数的本地存储器,以及到所述随机存取存储器的存储器接口;以及至少一个第二集成电路裸片,其上配置有所述随机存取存储器。8.根据权利要求7所述的装置,其进一步包括:第三集成电路裸片,其上配置有所述中央处理单元;其中所述存储器接口通过硅穿孔(TSV)连接到所述至少一个第二集成电路裸片中的所述随机存取存储器;其中所述中央处理单元通过硅穿孔(TSV)连接所述至少一个第二集成电路裸片中的所述随机存取存储器;且其中所述至少一个第二集成电路裸片堆叠于所述第一集成电路裸片与所述第二集成电路裸片之间。
9.根据权利要求7所述的装置,其中所述中央处理单元配置于所述第一集成电路上;且所述中央处理单元和所述深度学习加速器共享到所述随机存取存储器的接口。10.根据权利要求9所述的装置,其中所述中央处理单元和所述深度学习加速器进一步共享逻辑电路以从所述随机存取存储器加载指令。11.根据权利要求7所述的装置,其进一步包括:第四集成电路裸片,其上配置有电线;其中所述第一集成电路裸片中的所述深度学习加速器和所述至少第二集成电路裸片中的所述随机存取存储器是使用所述第四集成电路裸片中的所述电线和来自所述第四集成电路裸片的硅穿孔(TSV)连接的。12.根据权利要求11所述的装置,其进一步包括:第三集成电路裸片,其上配置有所述中央处理单元;其中所述第一集成电路裸片、所述至少第二集成电路裸片和所述第三集成电路裸片堆叠于所述第四集成电路裸片上且使用单独组的硅穿孔(TSV)连接到所述第四集成电路。13.根...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。