一种CNN模型及其训练方法、终端、计算机可读存储介质技术

技术编号：22884925 阅读：17 留言：0更新日期：2019-12-21 07:38

本发明专利技术公开了一种CNN模型及其训练方法、终端、计算机可读存储介质，属于CNN模型训练领域，要解决的问题为如何在保证模型训练性能的前提下分批量的实现对大批量样本的分析。其方法包括：在每个批量归一化层和与其相邻的上一个网络层之间插入一个同步层，输入层和与其相邻的同步层之间的所有网络层、以及任意相邻的两个同步层之间的所有网络层分别为一段单独的网络层单元；对于上述所有的网络层单元通过数据分批次的方式逐段进行前向传播。该CNN模型为线性结构，且为上述训练方法训练得到的模型。终端中处理器被配置用于调用所述程序指令执行上述训练方法。计算机可读存储介质中，程序指令当被处理器执行时所述处理器执行上述训练方法。

A CNN model and its training method, terminal, computer readable storage medium

全部详细技术资料下载

【技术实现步骤摘要】
一种CNN模型及其训练方法、终端、计算机可读存储介质
本专利技术涉及CNN模型训练领域，具体地说是一种CNN模型及其训练方法、终端、计算机可读存储介质。
技术介绍
批量归一化(英文全称为BatchNormalization，英文简称为BN)能够加快深度神经网络模型的收敛，降低参数初始化的要求，具有尺度不变性，使得模型损失函数曲面更加平滑，所以这种归一化方法被广泛应用在深度模型中，尤其适用于卷积神经网络层。批量归一化算子一般放在卷积层(或全连接层)与激活层之间，算子对前一层输出的净激活值x进行变换，公式如下：其中，μ和σ分别为净激活值x所属集合的均值和方差，在模型训练过程中统计而来；γ和β分别为尺度超参数和偏移超参数。当BN层放在全连接层之后时，每个神经元的输出值组成一个集合，计算该集合的均值和方差。因此当批量batchsize设定为N个时，计算每个神经元输出的N个净激活值的均值和方差，然后按照上述变换公式进行归一化。当BN层放在卷积层之后是，每个卷积核输出一个通道的特征图，当批量batchsize设定为N个时，该卷积核输出该通道上的N个特征图，统计这N个特征图所有净激活值的均值和方差，然后对该通道的特征图按照上述公式进行归一化。由上可以看出，批量归一化算子在对模型某层的输出进行变换时，按照批量样本在卷积核对应的通道上的特征图或神经元对应的输出统计均值和方差。因此，在训练过程中每一步输入批量样本，模型同时计算出该批量样本在某一层的输出，然后统计输出的均值方差。传统模式下，...

【技术保护点】
1.一种CNN模型的训练方法，其特征在于应用于呈线性结构的CNN模型，且所述CNN模型具有批量归一化层，所述训练方法包括如下步骤：/n在每个批量归一化层和与其相邻的上一个网络层之间插入一个同步层，所述同步层用于暂存与其相邻的上一个网络层的输出、并用于启动与其相邻的批量归一化层对输入数据的批量运算；/n输入层和与其相邻的同步层之间的所有网络层、以及任意相邻的两个同步层之间的所有网络层分别为一段单独的网络层单元；/n对于上述所有的网络层单元通过数据分批次的方式逐段进行前向传播；/n所述通过数据分批次的方式逐段进行前向传播为：对于每个网络层单元，将其输入数据分批次的输入所述网络层单元并暂存于同步层，汇总同步层的输出组成大批量样本，通过对应的批量归一化层对所述大批量样本进行归一化。/n

【技术特征摘要】
1.一种CNN模型的训练方法，其特征在于应用于呈线性结构的CNN模型，且所述CNN模型具有批量归一化层，所述训练方法包括如下步骤：
在每个批量归一化层和与其相邻的上一个网络层之间插入一个同步层，所述同步层用于暂存与其相邻的上一个网络层的输出、并用于启动与其相邻的批量归一化层对输入数据的批量运算；
输入层和与其相邻的同步层之间的所有网络层、以及任意相邻的两个同步层之间的所有网络层分别为一段单独的网络层单元；
对于上述所有的网络层单元通过数据分批次的方式逐段进行前向传播；
所述通过数据分批次的方式逐段进行前向传播为：对于每个网络层单元，将其输入数据分批次的输入所述网络层单元并暂存于同步层，汇总同步层的输出组成大批量样本，通过对应的批量归一化层对所述大批量样本进行归一化。

2.根据权利要求1所述的一种CNN模型的训练方法，其特征在于在每个批量归一化层和与其相邻的上一个网络层之间插入一个同步层，包括如下步骤：
查找到所述CNN模型中所有的批量归一化层；
按照批量归一化层在所述模型中的出现次序组成划分节点；
在划分节点插入同步层，所述同步层位于对应批量归一化层之前。

3.根据权利要求2所述的一种CNN模型的训练方法，其特征在于根据所述CNN模型的模型结构描述文件查找到所述CNN模型中所有的批量归一化层。

4.根据权利要求1所述的一种CNN模型的训练方法，其特征在于对于每个网络层单元，将其输入数据分批次的输入所述网络层单元并暂存于同步层，汇总同步层的输出组成大批量样本，包括如下步骤：
根据所述网络层单元的结构、所述CNN模型的运行环境以及输入数据的大小，将输入数据划分为多个小批量样本；
前向传播时，将所述多个小批量样本依次输入所述网络层单元，且每个小批量样本传播至同步层停止继续传播并等待下一个小批量样本，直至所有的小批量样本均传送至所述同步层；
汇总同步层的输出，组成大批量样本。

5.根据权利要求4所述的一...

【专利技术属性】
技术研发人员：高岩，姜凯，郝虹，于治楼，李朋，
申请(专利权)人：山东浪潮人工智能研究院有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人