经由并行和片上存储器进行时间、空间和能量高效神经推断制造技术

技术编号：26610799 阅读：62 留言：0更新日期：2020-12-04 21:36

提供了经由并行和片上存储器提供时间，空间和能量高效的神经推断的神经推断芯片和核。在各种实施例中，神经推断芯片包括：多个神经核，所述多个神经核通过片上网络互连；第一片上存储器，用于存储神经网络模型，所述第一片上存储器通过所述片上网络连接到所述多个核中的每一个；第二片上存储器，用于存储输入和输出数据，所述第二片上存储器通过所述片上网络连接到所述多个核中的每一个。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】经由并行和片上存储器进行时间、空间和能量高效神经推断
技术介绍
本公开的实施例涉及神经网络，并且更具体地，涉及适于经由并行和片上(on-chip)存储器提供时间、空间和能量高效的神经推断的神经推断芯片和核。
技术实现思路
根据本公开的实施例，提供了神经推断芯片。在各种实施例中，神经推断芯片包括：多个神经核，所述多个神经核通过片上网络互连；第一片上存储器，用于存储神经网络模型，所述第一片上存储器通过所述片上网络连接到所述多个核中的每一个；第二片上存储器，用于存储输入和输出数据，所述第二片上存储器通过所述片上网络连接到所述多个核中的每一个。根据本公开的实施例，提供了用于操作神经网络的方法和计算机程序产品。从神经推断芯片上的第一片上存储器读取神经网络模型。根据神经网络模型配置神经推断芯片上的多个神经核。从神经推断芯片上的第二片上存储器读取输入。将输入提供给多个神经核。所述输入被多个神经核变换成输出。将输出写入神经推断芯片上的第二片上存储器。根据本公开的实施例，提供了用于配置神经推断芯片的方法和计算机程序产品。在运行时间之前，将神经网络模型加载到神经推断芯片上的第一片上存储器。在运行时间期间，根据神经网络模型配置神经推断芯片上的多个神经核。在运行时间期间，用输入数据更新神经推断芯片上的第二片上存储器。输入数据被多个神经核变换成输出数据。输出数据被写入神经推断芯片上的第二片上存储器。根据本公开的实施例，提供了用于操作神经推断芯片的方法和计算机程序产品。输入数据被写入神经推断芯片的第二存储器。在一些实施例中，输入数...

【技术保护点】
1.一种神经推断芯片，包括：/n多个神经核，所述多个神经核通过片上网络互连；/n第一片上存储器，用于存储神经网络模型，所述第一片上存储器通过所述片上网络连接到所述多个核中的每一个；/n第二片上存储器，用于存储输入和输出数据，所述第二片上存储器通过所述片上网络连接到所述多个核中的每一个。/n

【技术特征摘要】
【国外来华专利技术】20180420 US 15/958,5881.一种神经推断芯片，包括：
多个神经核，所述多个神经核通过片上网络互连；
第一片上存储器，用于存储神经网络模型，所述第一片上存储器通过所述片上网络连接到所述多个核中的每一个；
第二片上存储器，用于存储输入和输出数据，所述第二片上存储器通过所述片上网络连接到所述多个核中的每一个。

2.如权利要求1所述的神经推断芯片，还包括：
至少一个连接到所述多个神经核的控制器、所述第一片上存储器和所述第二片上存储器；
用于存储控制器指令的第三片上存储器，所述第三片上存储器连接到所述至少一个控制器。

3.如权利要求2所述的神经推断芯片，其中所述至少一个控制器经由所述片上网络连接到所述多个神经核、所述第一片上存储器和所述第二片上存储器。

4.如权利要求1所述的神经推断芯片，其中所述多个神经核中的每一个还包括：本地存储器，其用于存储所述神经网络模型的一部分。

5.如权利要求1所述的神经推断芯片，其中所述多个神经核中的每一个还包括：本地存储器，其用于存储所述输入和输出数据的一部分。

6.如权利要求1所述的神经推断芯片，其中所述多个神经核中的每一个还包括：本地存储器，其用于存储控制器指令。

7.如权利要求1所述的神经推断芯片，其中所述多个神经核中的每一个还包括：本地控制器。

8.如权利要求1所述的神经推断芯片，其中所述多个神经核形成阵列。

9.如权利要求4所述的神经推断芯片，其中所述多个核中的每一个通过所述片上网络连接到所述阵列内的相邻核。

10.一种神经推断芯片，包括：
一个或多个神经核的阵列；
第一存储器，用于存储神经网络模型；
第二存储器，用于存储输入和输出数据；
第三存储器，用于存储瞬态数据；
第四存储器，用于存储控制器指令；以及
至少一个片上网络，其中
神经网络模型包括一个或多个适于将输入数据转换成输出数据的互连处理层，
一个或多个神经核的阵列中的每一个适于经由至少一个片上网络将中间数据直接传送至一个或多个神经核的阵列中的另一个，
神经推断芯片适于执行控制器指令以控制由一个或多个神经核的阵列应用的转换操作并且引导一个或多个神经核的阵列与存储器之间的数据流。

11.如权利要求10所述的神经推断芯片，其中所述神经核中的每一个至少包括所述第一存储器、所述第二存储器、所述第三存储器、或所述第四存储器的局部部分。

12.如权利要求10所述的神经推断芯片，其中所述第一存储器、所述第二存储器、所述第三存储器或所述第四存储器分布在所述神经核之间。

13.如权利要求10所述的神经推断芯片，其中所述第一存储器、所述第二存储器、所述第三存储器或所述第四存储器包括神经核本地的部分和集中部分。

14.如权利要求10所述的神经推断芯片，其...

【专利技术属性】
技术研发人员：D·莫德哈，J·V·亚瑟，J·萨瓦达，S·K·埃塞尔，R·阿普斯瓦米，B·S·塔巴，A·S·卡西迪，P·达塔，M·弗利克纳，H·佩纳，J·克拉莫，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：美国;US

全部详细技术资料下载我是这个专利的主人