一种神经网络的训练方法和设备技术

技术编号:14550737 阅读:117 留言:0更新日期:2017-02-04 23:51
本发明专利技术的实施方式提供了一种神经网络的训练方法。该方法包括:构建第一初始深度神经网络;利用第一训练数据对所述第一初始深度神经网络进行训练,以形成第一目标深度神经网络;其中,所述第一初始深度神经网络的输出层上包括第一输出节点和辅助节点,其中,每一所述第一输出节点分别对应所述第一初始深度神经网络的每一可输出对象,所述第一输出节点的数量等于所述第一初始深度神经网络的可输出对象的数量,所述辅助节点不对应所述第一初始深度网络的任何可输出对象。此外,本发明专利技术的实施方式提供了一种神经网络的训练设备。

Method and apparatus for training neural network

The embodiment of the invention provides a method for training a neural network. The method comprises: constructing the first initial depth of neural network; using the training on the first initial depth of the neural network for the first training data to form a first target depth of neural network; which includes a first output node and slave nodes, the output layer of the first initial depth of the neural network, each of the first output node corresponding to the first initial depth of the neural network can output the number of each object, the first output node is equal to the number of objects can output the first initial depth of the neural network, the auxiliary nodes do not correspond to the first initial depth network can output any object. In addition, the embodiment of the invention provides a training device for a neural network.

【技术实现步骤摘要】

本专利技术的实施方式涉及数据处理
,更具体地,本专利技术的实施方式涉及一种神经网络的训练方法和设备
技术介绍
本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。许多计算机应用、网络服务应用都具有利用输入对象计算输出对象的数据处理需求。例如,在具有图像识别功能的应用中,图像作为输入对象,图像所属的图像标签作为输出对象,这些应用需要根据图像计算出图像所属的图像标签,从而实现图像识别。其中,图像标签表示图像划分的类别。目前,在现有的数据处理技术中,利用输入对象计算输出对象的数据处理,可以采用神经网络来实现。具体地,神经网络可以为输入对象提供多个可输出对象,采用已知对应关系的输入对象与输出对象所组成的训练数据,对神经网络进行训练,以使得训练后的神经网络能够表示不同的输入对象与各可输出对象之间的对应关系,因此,将未知对应输出对象的输入对象输入到训练后的神经网络之后,训练后的神经网络通过计算就可以输出该输入对象对应的输出对象。
技术实现思路
专利技术人经过研究发现,现有技术中,神经网络具有输入层和输出层,其中,输出层上的每一个输出节点对应于一个可输出对象,即,输出层上的节点数量与可输出对象的数量是相同的。但是,在可输出对象的数量过大的情况下,如果训练数据较少或对应各可输出对象的训练数据不均衡,就可能导致神经网络训练的过程中总体误差的上下波动,导致训练无法收敛,从而造成训练后的神经网络无法为输入对象计算出准确的输出对象。因此在现有技术中,神经网络训练经常出现无法收敛的问题,从而造成训练后的神经网络无法为输入对象计算准确的输出对象,这是非常令人烦恼的过程。为此,非常需要一种改进的神经网络训练方法和设备,以避免神经网络训练无法收敛的问题,从而使得训练后的神经网络可以为输入变量计算准确的输出变量。在本上下文中,本专利技术的实施方式期望提供一种神经网络的训练方法和设备。在本专利技术实施方式的第一方面中,提供了一种训练神经网络的方法,包括:构建第一初始深度神经网络;利用第一训练数据对所述第一初始深度神经网络进行训练,以形成第一目标深度神经网络;其中,所述第一初始深度神经网络的输出层上包括第一输出节点和辅助节点,其中,每一所述第一输出节点分别对应所述第一初始深度神经网络的每一可输出对象,所述第一输出节点的数量等于所述第一初始深度神经网络的可输出对象的数量,所述辅助节点不对应所述第一初始深度网络的任何可输出对象。在本专利技术第一方面的一个实施例中,所述方法还包括:对所述第一目标深度神经网络上的节点进行改造,以形成第二初始深度神经网络;利用第二训练数据对所述第二初始深度神经网络进行训练,以形成第二目标深度神经网络;其中,所述第二初始深度神经网络的输出层上包括第二输出节点,每一所述第二输出节点分别对应所述第二初始深度神经网络的每一可输出对象,所述第二输出节点的数量等于所述第二初始深度神经网络的可输出对象的数量;所述第一初始深度神经网络的可输出对象为待识别对象的第一类别,所述第二初始深度神经网络的可输出对象为待识别对象的第二类别,所述第二类别为所述第一类别的细化分类。在本专利技术第一方面的另一个实施例中,所述对所述第一目标深度神经网络上的节点进行改造,以形成第二初始深度神经网络,包括:在所述第一目标深度神经网络中,将输出层上的每一第一输出节点扩展成至少一个所述第二输出节点并删除输出层上的所述辅助节点,以形成所述第二初始深度神经网络;其中,对于任意一个所述第一输出节点,该第一输出节点扩展出的第二输出节点对应的第二类别为该第一输出节点对应的第一类别的细化类别。在本专利技术第一方面的又一个实施例中,所述对所述第一目标深度神经网络上的节点进行改造,以形成第二初始深度神经网络,包括:在所述第一目标深度神经网络中,将输出层上的每一所述第一输出节点扩展成至少一个所述第二输出节点并增加输出层之前一层上的节点数量,以形成所述第二初始深度神经网络;其中,对于任意一个所述第一输出节点,该第一输出节点扩展出的第二输出节点对应的第二类别为该第一输出节点对应的第一类别的细化类别。在本专利技术第一方面的再一个实施例中,利用第一训练数据对所述第一初始深度神经网络进行训练,以形成第一目标深度神经网络,包括:将所述第一训练数据的输入值输入所述第一初始深度神经网络的输入层,在所述第一初始深度神经网络中对所述输入值进行正向处理,以在所述第一初始深度神经网络的输出层得到正向处理输出值;计算所述输入值在第一训练数据中对应的输出值与所述正向处理输出值之间的误差值;以所述误差值输入所述第一初始深度神经网络的输出层,在所述第一初始深度神经网络中对所述误差值进行反向传播,以修正所述第一初始深度神经网络中的参数,从而形成所述第一目标深度神经网络。在本专利技术第一方面的又再一个实施例中,所述方法应用于图像识别,所述待识别对象为图像信息,所述第二类别为用于对图像进行分类的图像标签,所述第一类别为用于对所述图像标签进行分类的类别。在本专利技术实施方式的第二方面中,提供了一种训练神经网络的设备,包括:构建模块,用于构建第一初始深度神经网络;第一训练模块,用于利用第一训练数据对所述第一初始深度神经网络进行训练,以形成第一目标深度神经网络;其中,所述第一初始深度神经网络的输出层上包括第一输出节点和辅助节点,其中,每一所述第一输出节点分别对应所述第一初始深度神经网络的每一可输出对象,所述第一输出节点的数量等于所述第一初始深度神经网络的可输出对象的数量,所述辅助节点不对应所述第一初始深度网络的任何可输出对象。在本专利技术第二方面的一个实施例中,所述设备还包括:改造模块,用于对所述第一目标深度神经网络上的节点进行改造,以形成第二初始深度神经网络;第二训练模块,用于利用第二训练数据对所述第二初始深度神经网络进行训练,以形成第二目标深度神经网络;其中,所述第二初始深度神经网络的输出层上包括第二输出节点,每一所述第二输出节点分别对应所述第二初始深度神经网络的每一可输出对象,所述第二输出节点的数量等于所述第二初始深度神经网络的可输出对象的数量;所述第一初始深度神经网络的可输出对象为待识别对象的第一类别,所述第二初始深度神经网络的可输出对象为待识别对象的第二类别,所述第二类别为所述第一类别的细化分类。在本专利技术第二方面的另本文档来自技高网...

【技术保护点】
一种方法,包括:构建第一初始深度神经网络;利用第一训练数据对所述第一初始深度神经网络进行训练,以形成第一目标深度神经网络;其中,所述第一初始深度神经网络的输出层上包括第一输出节点和辅助节点,其中,每一所述第一输出节点分别对应所述第一初始深度神经网络的每一可输出对象,所述第一输出节点的数量等于所述第一初始深度神经网络的可输出对象的数量,所述辅助节点不对应所述第一初始深度网络的任何可输出对象。

【技术特征摘要】
1.一种方法,包括:
构建第一初始深度神经网络;
利用第一训练数据对所述第一初始深度神经网络进行训练,以形成
第一目标深度神经网络;
其中,所述第一初始深度神经网络的输出层上包括第一输出节点和
辅助节点,其中,每一所述第一输出节点分别对应所述第一初始深度神
经网络的每一可输出对象,所述第一输出节点的数量等于所述第一初始
深度神经网络的可输出对象的数量,所述辅助节点不对应所述第一初始
深度网络的任何可输出对象。
2.根据权利要求1所述的方法,还包括:
对所述第一目标深度神经网络上的节点进行改造,以形成第二初始
深度神经网络;
利用第二训练数据对所述第二初始深度神经网络进行训练,以形成
第二目标深度神经网络;
其中,所述第二初始深度神经网络的输出层上包括第二输出节点,
每一所述第二输出节点分别对应所述第二初始深度神经网络的每一可输
出对象,所述第二输出节点的数量等于所述第二初始深度神经网络的可
输出对象的数量;
所述第一初始深度神经网络的可输出对象为待识别对象的第一类
别,所述第二初始深度神经网络的可输出对象为待识别对象的第二类别,
所述第二类别为所述第一类别的细化分类。
3.根据权利要求2所述的方法,其中,所述对所述第一目标深度神
经网络上的节点进行改造,以形成第二初始深度神经网络,包括:
在所述第一目标深度神经网络中,将输出层上的每一第一输出节点
扩展成至少一个所述第二输出节点并删除输出层上的所述辅助节点,以
形成所述第二初始深度神经网络;
其中,对于任意一个所述第一输出节点,该第一输出节点扩展出的
第二输出节点对应的第二类别为该第一输出节点对应的第一类别的细化
类别。
4.根据权利要求2所述的方法,所述对所述第一目标深度神经网络
上的节点进行改造,以形成第二初始深度神经网络,包括:
在所述第一目标深度神经网络中,将输出层上的每一所述第一输出
节点扩展成至少一个所述第二输出节点并增加输出层之前一层上的节点
数量,以形成所述第二初始深度神经网络;
其中,对于任意一个所述第一输出节点,该第一输出节点扩展出的
第二输出节点对应的第二类别为该第一输出节点对应的第一类别的细化
类别。
5.根据权利要求1所述的方法,其中,利用第一训练数据对所述第
一初始深度神经网络进行训练,以形成第一目标深度神经网络,包括:
将所述第一训练数据的输入值输入所述第一初始深度神经网络的输
入层,在所述第一初始深度神经网络中对所述输入值进行正向处理,以
在所述第一初始深度神经网络的输出层得到正向处理输出值;
计算所述输入值在第一训练数据中对应的输出值与所述正向处理输
出值之间的误差值;
以所述误差值输入所述第一初始深度神经网络的输出层,在所述第
一初始深度神经网络中对所述误差值进行反向传播,以修正所述第一初
始深度神经网络中的参数,从而形成所述第一目标深度神经网络。
6.根据权利要求2所述的方法,应用于图像识别,
所述待识别对象为图像信息,所述第二类别为用于对图像进行分类
的图像标签,所述第一类别为用于对...

【专利技术属性】
技术研发人员:丛林李晓燕
申请(专利权)人:杭州朗和科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1