基于卷积神经网络的分类模型构建方法和设备技术

技术编号：11781852 阅读：139 留言：0更新日期：2015-07-27 21:19

公开了一种基于卷积神经网络的分类模型构建方法和设备，该方法包括：卷积步骤，以随机卷积方式对训练样本进行第一阶段训练，以得到用于卷积操作的卷积模板值，从而构建包括卷积模板值的分类模型，其中，以随机卷积方式对训练样本进行第一阶段训练进一步包括：对于至少一个当前卷积层，基于预定概率阈值以随机方式打断当前卷积层的特征图中的元素与和当前卷积层相邻的上一层的特征图中的元素之间的连接。根据本公开，可以减少训练样本时使用的权值数量，减轻过拟合问题，从而提高卷积神经网络的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及分类模型构建，更具体地，涉及一种基于卷积神经网络(CNN)的分类模型构建方法和设备。
技术介绍
卷积神经网络(CNN)是人工神经网络的一种，已成为当前语音分析和图像识别领域的研究热点。传统卷积神经网络的卷积层通常具有几十万到几百万个权值需要学习，同时训练时采用的梯度下降算法在后向传播过程中存在“梯度消失”的问题(即越往前一层梯度的调节量就越小)，这就导致大量的权值得不到充分学习。为了达到比较好的训练效果，传统卷积神经网络通常需要大量的训练样本，例如，当类别个数远远小于每类训练样本个数时效果较好。但当训练样本数量有限时，传统卷积神经网络容易出现过拟合的问题，导致训练出的模型的实际泛化能力不佳。同时，传统卷积神经网络中的采样层只从每个特征图上的每个局部区域中提取最大值，这样做减小了计算量，但导致信息过度损失，因为局部区域里的较小值也可以反映这个区域的部分特征。例如，图1示出了传统卷积神经网络的示意图。其中，方框中的数字“6”为输入图像，并且图中的每一个方框表示对输入图像执行特定操作(诸如滤波操作、卷积操作以及空间最大采样操作)之后得到的特征图。传统地，在对传统卷积神经网络进行训练时，首先随机给定网络中的参数(例如，卷积模板值)并输入训练样本，然后以前向传播经过多次重复的卷积操作、空间最大采样操作和全连接操作之后，在输出层得到识别结果的置信度，并根据该置信度与预定真值的误差进行后向传播，例如以经典的梯度下降算法对给定的网络参数进行优化。如此重复进行操作，直到输出层的置信度与预定真值的误差满足预定阈值。
技术实现思路
在下文中给出了关于本公开的...
基于卷积神经网络的分类模型构建方法和设备

【技术保护点】
一种基于卷积神经网络的分类模型构建方法，包括：卷积步骤，以随机卷积方式对训练样本进行第一阶段训练，以得到用于卷积操作的卷积模板值，从而构建包括所述卷积模板值的分类模型，其中，以随机卷积方式对训练样本进行第一阶段训练进一步包括：对于至少一个当前卷积层，基于预定概率阈值以随机方式打断当前卷积层的特征图中的元素与和所述当前卷积层相邻的上一层的特征图中的元素之间的连接。

【技术特征摘要】

【专利技术属性】
技术研发人员：吴春鹏，范伟，何源，孙俊，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人