RPU阵列的噪声和信号管理制造技术

技术编号：31568623 阅读：20 留言：0更新日期：2021-12-25 11:07

提供了在ANN训练期间用于RPU阵列的高级噪声和信号管理技术。在本发明专利技术的一个方面，一种用于ANN训练的方法包括：提供具有预归一化器和后归一化器的RPU器件的阵列；计算并预归一化属于每个预归一化器的集合组的到阵列的输入向量x的所有元素的平均值和标准偏差；以及计算并后归一化属于每个后归一化器的集合组的输出向量y的所有元素的平均值μ和标准偏差σ。差σ。差σ。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】RPU阵列的噪声和信号管理

[0001]本专利技术涉及具有电阻处理单元(Resistive Processing Unit，RPU)器件的模拟交叉点阵列的人工神经网络(Artificial Neural Network，ANN)的训练，更具体地，涉及在ANN训练期间用于RPU阵列的高级噪声和信号管理技术。

技术介绍

[0002]人工神经网络(ANN)可以体现在电阻器件的模拟交叉点阵列，例如在Gokmen等人的美国专利申请公开号2017/0109628，题为“Resistive Processing Unit”中描述的电阻处理单元(RPU)。如本文所描述，每个RPU包括第一端子、第二端子和有源区。有源区的导电状态识别RPU的权重值，该权重值可以通过向第一端子/第二端子施加信号来更新/调整。
[0003]基于ANN的模型已经用于各种不同的基于认知的任务，例如对象和语音识别以及自然语言处理。例如，参见Gokmen等人的“Training Deep Convolutional Neural Networks with Resistive Cross
‑
point Devices”，载于Frontiers in Neuroscience(《神经科学前沿》)第11卷538号文章(2017年10月)(13页)。当执行这些任务时，需要神经网络训练来提供高水平的精确度。
[0004]然而，在RPU阵列上执行的向量
‑
矩阵乘法运算本质上是模拟的，因此容易受到各种噪声源的影响。当RPU阵...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于具有噪声和信号管理的人工神经网络(ANN)训练的方法，所述方法包括以下步骤：提供电阻处理单元(RPU)器件的阵列，所述阵列具有被配置为处理到所述阵列的输入向量x的n个元素的大小为g的集合组的预归一化器，以及具有被配置为处理来自所述阵列的输出向量y的m个元素的大小为g的集合组的后归一化器，其中，所述阵列表示具有m行和n列的所述ANN的权重矩阵W，其中，权重矩阵W的权重值w被存储为所述RPU器件的电阻值；跨N个向量计算属于每个预归一化器的所述集合组的所述输入向量x的所有元素的平均值μ和标准偏差σ，产生所述预归一化器的当前平均值μ和标准偏差值σ，其中，所述平均值μ和所述标准偏差σ是在N乘以g个输入值上计算的；用折扣因子α更新所述预归一化器的先前存储的平均值μ和标准偏差值σ，所述预归一化器的所述当前平均值μ和标准偏差值σ产生所述预归一化器的更新的存储的平均值μ和标准偏差值σ；使用所述预归一化器的所述更新的存储的平均值μ和标准偏差值σ将所述N乘以g个输入值预归一化，从所有所述预归一化器产生N个归一化输入向量x
norm
，以通过所述阵列与前向循环传递中的模拟噪声一起计算W*x
norm
；跨所述N个向量计算属于每个所述后归一化器的所述集合组的所述输出向量y的所有元素的所述平均值μ和所述标准偏差σ，产生所述后归一化器的当前平均值μ和标准偏差值σ，其中，所述平均值μ和所述标准偏差σ是在N乘以g个输入值上计算的；用折扣因子α更新所述后归一化器的先前存储的平均值μ和标准偏差值σ，所述后归一化器的所述当前平均值μ和标准偏差值σ产生所述后归一化器的更新的存储的平均值μ和标准偏差值σ；使用所述后归一化器的所述更新的存储的平均值μ和标准偏差值σ将所述N乘以g个输出值后归一化，从所有所述后归一化器产生N个归一化输出向量y
norm
；使用所述先前的标准偏差σ变换N个输入向量d，产生N个变换的输入向量d
norm
，以通过所述阵列与反向循环传递中的模拟噪声一起计算W
T
*d
norm
；以及使用所述预归一化器的所述先前的标准偏差σ变换N个输出向量d
’
，以产生N个变换的输出向量d
′
norm
。2.根据权利要求1所述的方法，还包括以下步骤：初始化所述预归一化器和所述后归一化器中的每一个以使存储的平均值被设置为0，并且存储的标准偏差值被设置为1。3.根据权利要求1所述的方法，还包括以下步骤：在更新循环传递中利用来自所述前向循环传递的x
norm
和来自所述反向循环传递的d
norm
更新所述阵列。4.根据权利要求1所述的方法，还包括以下步骤：使用所述折扣因子α以(1
‑
α)*v
old
+α*v
new
更新所述预归一化器的所述先前存储的平均值μ和标准偏差值σ，其中，ν
old
是所述预归一化器的所述先前平均值和标准偏差，v
new
是针对所述输入向量x的元素计算的所述平均值和标准偏差。5.根据权利要求4所述的方法，还包括以下步骤：初始地设置所述折扣因子α的值大于0且小于1。
6.根据权利要求1所述的方法，还包括以下步骤：使用所述折扣因子α以(1
‑
α)*v
old
+α*v
new
更新所述后归一化器的所述先前存储的平均值μ和标准偏差值σ，其中，v
old
是所述后归一化器的所述先前平均值和标准偏差，v
new
是针对所述输出向量y的元素计算的所述平均值和标准偏差。7.根据权利要求6所述的方法，还包括以下步骤：初始地设置所述折扣因子α的值大于0且小于1。8.根据权利要求1所述的方法，其中，所述预归一化步骤包括以下步骤：对于所述预归一化器中的每一个，将所述N乘以g个值减去所述预归一化器的所述先前的平均值μ以获得结果；以及将所述结果除以所述预归一化器的所述先前的标准偏差σ。9.根据权利要求1所述的方法，还包括以下步骤：将所述N个变换后的输入向量d
norm
转换成模拟脉冲宽度；使用所述阵列计算具有模拟噪声的W
T
*d
norm
；以及以数字形式表示来自所述阵列的所述输出向量y。10.根据权利要求1所述的方法，还包括以下步骤：将所述N个变换后的输入向量x
norm
转换成模拟脉冲宽度；使用所述阵列计算具有模拟噪声的W*x
norm...

【专利技术属性】
技术研发人员：MJ拉施，T戈克曼，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人