深度神经网络的构建方法技术

技术编号：14348075 阅读：162 留言：0更新日期：2017-01-04 18:40

本发明专利技术公开了一种深度神经网络的构建方法，深度神经网络结构为共享参数的树状结构，包括多个共享参数的分支和多个Softmax层，当某个分支的收敛速度下降时，拥有多个输出的可分裂节点裂变出一个与可裂变节点类型相同的分裂节点，创建新的特征探测器并产生不同的特征，分裂节点的父节点和子节点继承可分裂节点，分裂节点的参数进行初始化。在多模型组合的前提下，既可以减少计算代价，又能分裂得到多个高质量的模型。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度神经网络结构，具体地涉及一种深度神经网络的构建方法。
技术介绍
随着深度学习在各个领域的普及，神经网络参数的规模越来越大。在深度神经网络的结构中，模型组合几乎都可以提高机器学习方法的性能。平均多模型预测可以进一步降低错误率。当前，对于神经网络的研究都集中于静态结构的神经网络，即在训练之前，网络的结构已经完全设计好并固定下来，之后也不会有变化。多列深度神经网络就是这样一个组合模型，它将多个固定结构的深度网络分别训练好，然后再平均预测所有深度网络的结果。虽然该模型相对以前的方法进一步把错误率减少了30％～40％，但是该多模型的计算量几乎相当于每个模型单独训练计算量的总和。随着深度学习的神经网络参数会越来越多，计算量越来越大，这样的多模型组合计算代价是相当昂贵的。而且多列深度神经网络每个模型的质量可能参差不齐，这也会影响到最后的预测的正确率。
技术实现思路
针对上述存在的技术问题，本专利技术目的是：提供一种深度神经网络的构建方法，在多模型组合的前提下，既可以减少计算代价，又能分裂得到多个高质量的模型。本专利技术的技术方案是：一种深度神经网络的构建方法，其特征在于，深度神经网络结构为共享参数的树状结构，包括多个共享参数的分支和多个Softmax层，当某个分支的收敛速度下降时，拥有多个输出的可分裂节点裂变出一个与可裂变节点类型相同的分裂节点，创建新的特征探测器并产生不同的特征，分裂节点的父节点和子节点继承可分裂节点，分裂节点的参数进行初始化。优选的，可裂变节点通过最低共同祖先算法查找，选择收敛最差的叶子节点，然后回溯找到第一个拥有多个子节点的节点作为...
深度神经网络的构建方法

【技术保护点】
一种深度神经网络的构建方法，其特征在于，深度神经网络结构为共享参数的树状结构，包括多个共享参数的分支和多个Softmax层，当某个分支的收敛速度下降时，拥有多个输出的可分裂节点裂变出一个与可裂变节点类型相同的分裂节点，创建新的特征探测器并产生不同的特征，分裂节点的父节点和子节点继承可分裂节点，分裂节点的参数进行初始化。

【技术特征摘要】
1.一种深度神经网络的构建方法，其特征在于，深度神经网络结构为共享参数的树状结构，包括多个共享参数的分支和多个Softmax层，当某个分支的收敛速度下降时，拥有多个输出的可分裂节点裂变出一个与可裂变节点类型相同的分裂节点，创建新的特征探测器并产生不同的特征，分裂节点的父节点和子节点继承可分裂节点，分裂节点的参数进行初始化。2.根据权利要求1所述的深度神经网络的构建方法，其特征在于，可裂变节点通过最低共同祖先算法查找，选择收敛最差的叶子节点，然后回溯找到第一个拥有多个子节点的节点作为可分裂节点。3.一种深度神经网络的构建系统，其特征在于，深度神经网络结构为共享参数的树状结构，包括多个共享参数的分支和多个Softmax层，构建系统包括分裂模块，用于当某个分支的收敛速度下降时，拥有多个输出的可分裂节点裂变出一个与可裂变节点类型相同的分裂节点，创建新的特征探测器并产生不同的特征，分裂节点的父节点和子节点继承可分裂节点，对分裂节点的参数进行初始...

【专利技术属性】
技术研发人员：吴俊敏，谭东旭，郑焕鑫，
申请(专利权)人：中国科学技术大学苏州研究院，苏州展科光电科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人