神经网络批标准化层硬件实现方法、装置、设备及介质制造方法及图纸

技术编号：33530100 阅读：13 留言：0更新日期：2022-05-19 01:59

本申请涉及神经网络计算技术领域，特别涉及一种神经网络批标准化层硬件实现方法、装置、设备及介质，其中，方法包括：将神经网络的权重参数以电导形式存储至忆阻器阵列中；基于上一个卷积层的卷积结果，根据忆阻器阵列的每根源线流经的实际电流得到对应量化结果；将量化结果送入至下一个卷积层，以进行卷积层计算。由此，采用基于忆阻器阵列实现存算一体任务中常用的ADC模块，实现了BN层计算，以及激活函数模块，节约了处理器进行BN层计算的额外的开销，提升系统能效。提升系统能效。提升系统能效。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络批标准化层硬件实现方法、装置、设备及介质

[0001]本申请涉及神经网络计算
，特别涉及一种神经网络批标准化层硬件实现方法、装置、设备及介质。

技术介绍

[0002]批标准化层(Batch Normalization，BN层)是深度神经网络训练中常用的模块。它将分布比较离散的输出结果集中在一定范围内，避免梯度消失问题，加快网络训练速度。BN层的硬件实现方法中，比较常用的是通过和改进阈值进行对比。
[0003]相关技术中，如图1所示，在二值神经网络中，每一层的输出值为1或者
‑
1。X
N
，Y
N
，Z
N
分别是第N个的卷积层，BN层，符号位判断模块的结果。卷积层的输出向量在经过BN层后，需要判断其符号位送到下一个卷积层计算，如下面的公式所示：
[0004][0005]改进的阈值方案，将BN层计算和后面的符号位判断模块结合起来。具体的计算公式如下：
[0006][0007]假设k>0，k<0同理，此方法避开了BN层的繁琐计算步骤，大大降低了计算开销。
[0008]然而，改进阈值的BN层实现方案是针对二值神经网络设计的，每一层的输出值只有两个取值，计算步骤比较简单。但是对于精度更高的神经网络硬件实现，该方法并不适用，亟待解决。
[0009]申请内容
[0010]本申请提供一种神经网络批标准化层硬件实现方法、装置、设备及介质，采用基于忆阻器阵列实现存算一体任务中常用的...

【技术保护点】

【技术特征摘要】
1.一种神经网络批标准化层硬件实现方法，其特征在在于，包括以下步骤：将神经网络的权重参数以电导形式存储至忆阻器阵列中；基于上一个卷积层的卷积结果，根据所述忆阻器阵列的每根源线流经的实际电流得到对应量化结果；以及将所述量化结果送入至下一个卷积层，以进行卷积层计算。2.根据权利要求1所述的方法，其特征在于，所述根据所述忆阻器阵列的每根源线流经的实际电流得到对应量化结果，包括：对预设范围进行8bit量化，得到所述量化结果。3.根据权利要求1所述的方法，其特征在于，所述预设范围为：其中，Z
max
为批标准化层计算结果的上限值，β，γ，σ，μ均为所述批标准化层的参数，ε为极小值。4.根据权利要求2所述的方法，其特征在于，在根据所述忆阻器阵列的每根源线流经的实际电流得到所述对应量化结果之前，还包括：按照预设充放电策略对积分器中的电容进行充放电，以对所述上一个卷积层的卷积结果进行积分。5.根据权利要求4所述的方法，其特征在于，所述对预设范围进行8bit量化，得到所述量化结果，包括：将所述积分器的输出电压，送至8bitADC中，将所述卷积结果量化到预设电压内多个电平。6.一种神经网络批标准化层硬件实现装置，其特征在在于，包括：存储模块，用于将神经网络的权重参数以电导形式存储至忆阻器阵列中；获取模块，用于基于上一个卷积层的卷积结果，根据所述忆阻器阵列的每根源线流经的实际电流...

【专利技术属性】
技术研发人员：高滨，周颖，刘琪，唐建石，张清天，钱鹤，吴华强，
申请(专利权)人：清华大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人