一种多层输出的神经网络训练方法、系统及装置制造方法及图纸

技术编号：35305833 阅读：45 留言：0更新日期：2022-10-22 12:56

本发明专利技术提供一种多层输出的神经网络训练方法，包括：S1，将神经网络划分为按照顺序依次连接的N个子网络，N为正整数，每一子网络对应设有输出层；S2，通过每个子网络对应的输出层获得相应子网络的梯度并基于所得到的梯度值更新相应子网络的参数，N个子网络的迭代训练相互独立，直至N个子网络均收敛；S3，按照所述子网络的连接顺序，依次使第i个子网络(1≤i≤N

全部详细技术资料下载

【技术实现步骤摘要】
一种多层输出的神经网络训练方法、系统及装置

[0001]本专利技术涉及人工智能领域，具体涉及一种多层输出的神经网络训练方法、系统及装置。

技术介绍

[0002]在计算机视觉如图像识别或者目标检测问题中，所使用的神经网络的层数往往高达50层、甚至100层以上。在训练过程中，如此多的层数，只有末尾的若干层能够对输出层产生较大影响，而前层参数对输出层的影响则较小，原因是使用梯度下降法计算梯度时，梯度从后向前经过层层传递逐渐失真，前层已经无法获得有效的梯度信息，导致前层参数很难得以有效更新。
[0003]目前，针对此问题，比较广泛使用的方法是使用残差网络，但是此方法对前层参数更新效率的提升幅度有限，原因是其在训练过程中基于损失函数所计算出的梯度要到达前层，仍然需要多层传递，梯度的传输路径较长，导致前层参数更新效率低，也致使后层神经网络检测精度降低。

技术实现思路

[0004]针对上述
技术介绍
中提出的问题，本专利技术提供一种提高神经网络前层参数更新效率的多层输出的神经网络训练方法。
[0005]为达到上述目的，本专利技术所采用的技术方案是：
[0006]一种多层输出的神经网络训练方法，包括以下步骤：
[0007]S1，将神经网络划分为按照顺序依次连接的N个子网络，N为正整数，每一子网络对应设有输出层；
[0008]S2，通过每个子网络对应的输出层获得相应子网络的梯度并基于所得到的梯度值更新相应子网络的参数，N个子网络的迭代训练相互独立，直至N个子网络均收敛；
[0...

【技术保护点】

【技术特征摘要】
1.一种多层输出的神经网络训练方法，其特征在于，包括以下步骤：S1，将神经网络划分为按照顺序依次连接的N个子网络，N为正整数，每一子网络对应设有输出层；S2，通过每个子网络对应的输出层获得相应子网络的梯度并基于所得到的梯度值更新相应子网络的参数，N个子网络的迭代训练相互独立，直至N个子网络均收敛；S3，按照所述子网络的连接顺序，依次使第i个子网络(1≤i≤N
‑
1)的输出层停止工作；S4，当第i个子网络的输出层停止工作后，使用第i+1个子网络的输出层获得前i+1个子网络构成的整体网络的梯度，并基于所得到的梯度值更新前i+1个子网络的参数；S5，重复步骤S4对所述整体网络进行迭代训练直至所述整体网络收敛。2.如权利要求1所述的多层输出的神经网络训练方法，其特征在于，采用梯度下降法计算相应子网络的梯度值。3.如权利要求1所述的多层输出的神经网络训练方法，其特征在于，所述N的取值为4～5。4.如权利要求1所述的多层输出的神经网络训练方法，其特征在于，所有输出层执行相同的任务。5.如权利要求1所述的多层输出的神经网络训练方法，其特征在于，所述梯度值是基于输出层的输出值与训练样本设定的标签的差值，求出损失函数对所述差值的偏导数而得。6.如权利要求1所述的多层输出的神经网络训练方法，其特征在于，通过N
‑
1次下采样将神经网络分为N个子网络。7.一种多层输出的神经网络训练系统，其特征在于，包括：网络划分模块，用于将神经网络划分为按照顺序依次连接的N个子网络，N为正整数，每一子网络对应设有输出层；第一网络训练模块，用于通过每个子网络对应的输出层获得相应子网络的梯度并基于所得到的梯度值更新相应子网络的参数，N个...

【专利技术属性】
技术研发人员：蔡启明，杨蓉，黄俊明，李宇挺，章伟，
申请(专利权)人：广西大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人