用于卷积神经网络的装置制造方法及图纸

技术编号：21687065 阅读：25 留言：0更新日期：2019-07-24 14:55

一种用于卷积神经网络的装置，包括处理引擎二维阵列。处理引擎二维阵列配置为接收输入数据和权重数据，包括：N个处理引擎行和M个处理引擎列的阵列，其中N和M均为大于等于2的正整数。处理引擎二维阵列对输入数据和权重数据进行卷积运算后输出中间结果。处理引擎二维阵列的处理引擎配置为在所述卷积运算后自带池化处理。处理引擎二维阵列还可能具有全连接结构，中间结果在处理引擎二维阵列内部叠传。该装置实现了高速处理输入张量数据且能灵活地应对不同维度的输入张量数据。

Devices for Convolutional Neural Networks

全部详细技术资料下载

【技术实现步骤摘要】
用于卷积神经网络的装置
本公开涉及神经网络卷积运算张量处理器，更具体地，涉及用于卷积神经网络的装置。
技术介绍
神经网络通过模拟人类大脑的神经连接结构来建立模型结构，是目前学术研究和企业研发的热点。当前的神经网络，特别是用于图像处理和对象识别的卷积神经网络，需要处理大量表示为三阶或者更高阶张量的数据，也需要处理具有不同形状和大小的张量数据。因此需要能够高速处理不同形状的三阶或更高阶张量数据的神经网络专用计算装置。此外，二值化神经网络指的是对权重值和/或输入数据进行二值化处理后的神经网络。当前还没有针对二值化神经网络的高精度计算装置。
技术实现思路
基于此，有必要提供能够高速处理三阶或更高阶张量数据的神经网路专用计算装置，也有必要提供针对二值化神经网络的高精度计算装置。为此，本公开提供一种张量处理器，该张量处理器包括多个处理引擎(ProcessingEngine，以下简称PE)以及与多个PE相连的乒乓控制器。该张量处理器能根据实际需要(比如根据输入的张量数据的维度和卷积核的维度等信息)确定要调用的PE的个数以及由被调用的PE所组成的二维阵列的维度，调用多个PE的全部或一部分来组成PE二维阵列。进一步地，该张量处理器配置PE二维阵列的PE彼此之间的连接关系和数据流向，还可以根据PE二维阵列的维度来切割输入的张量数据，从而实现了高速处理输入张量数据且能灵活地应对不同维度的输入张量数据。针对二值神经网络的推导运算，该张量处理器用硬件方式取代卷积运算，还有对卷积运算结果进行门限操作，从而实现了兼具高速度和高精度优势的二值神经网络计算装置。根据本公开的一个方面，提供了一种...

【技术保护点】
1.一种用于卷积神经网络的装置，所述装置包括处理引擎二维阵列，所述处理引擎二维阵列配置为接收输入数据和权重数据，所述处理引擎二维阵列包括：N个处理引擎行和M个处理引擎列的阵列，其中N和M均为大于等于2的正整数；所述处理引擎二维阵列对所述输入数据和所述权重数据进行卷积运算后输出中间结果；其中所述处理引擎二维阵列的处理引擎配置为在所述卷积运算后自带池化处理。

【技术特征摘要】
1.一种用于卷积神经网络的装置，所述装置包括处理引擎二维阵列，所述处理引擎二维阵列配置为接收输入数据和权重数据，所述处理引擎二维阵列包括：N个处理引擎行和M个处理引擎列的阵列，其中N和M均为大于等于2的正整数；所述处理引擎二维阵列对所述输入数据和所述权重数据进行卷积运算后输出中间结果；其中所述处理引擎二维阵列的处理引擎配置为在所述卷积运算后自带池化处理。2.根据权利要求1所述的装置，其特征在于，所述输入数据和所述权重数据均为三阶或更高阶的张量，所述处理引擎二维阵列中的处理引擎之间的连接关系和数据流向是根据所述输入数据的维度和所述权重数据的维度来配置。3.根据权利要求1所述的装置，其特征在于，所述处理引擎二维阵列中的一部分处理引擎根据所述输入数据的维度和所述处理引擎二维阵列的维度被设置为待机状态。4.根据权利要求1所述的装置，其特征在于，所述输入数据为三阶或更高阶的张量，所述输入数据根据所述处理引擎二维阵列的维度被切割。5.根据权利要求1所述的装置，其特征在于，当所述处理引擎二维阵列中的第一部分处理引擎的权重数据被改变的时候，所述处理引擎二维阵列中的第二部分处理引擎的权重数据保持不变，并且所述第二部分处理引擎的的输入数据被改变。6.根据权利要求1所述的装置，其特征在于，所述处理引擎二维阵列的输出结果为对所述中间结果进行正则化操作后得到的正则化结果。7.根据权利要求1所述的装置，其特征在于，所述处理引擎二维阵列中的每一个处理引擎分配一个输入数据本地ID和一个权重数据本地ID，所述输入数据的每一个分量分配一个输入数据ID，所述权重数据的每一个分量分配一个权重数据ID，所述处理引擎二维阵列中的每一个处理引擎通过比较该处理引擎的输入数据本地ID和输入数据ID而匹配地接收所述输入数据的分量，所述处理引擎二维阵列中的每一个处理引擎通过比较该处理引擎的权重数据本地ID和权重数据ID而匹配地接收所述权重数据的分量。8.根据权利要求1所述的装置，其特征在于，所述输入数据和所述权重数据均进行了二值化处理，所述处理引擎二维阵列进行二值化神经网络卷积运算得到二值化神经网络卷积运算中间结果。9.根据权利要求8所述的装置，其特征在于，所述二值化神经网络卷积运算中间结果与训练好的门限值阈值进行比较。10.根据权利要求8所述的处理引擎二维阵列，其特征在于，所述二值化神经网络卷积运算的相乘操作通过异或非逻辑门操作实现，所述二值化神经网络卷积运算的相加操作通过数1的个数的操作实现。11.一种用于卷...

【专利技术属性】
技术研发人员：陈柏纲，许喆，丁雪立，
申请(专利权)人：北京异构智能科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人