The invention provides an incremental training method and system of deep neural network based on learning automata, which includes: training steps of original sample set: training deep neural network model with original training sample set; training steps of incremental sample set: expanding the category of the previous training sample set, and adopting the expanded training sample set to the depth of the previous training. Neural network model is incremental training. The training process on complex data sets can be decomposed into a series of simple task training processes, and the classification problem of all categories can be solved step by step through incremental model training. This cumulative learning strategy is more in line with the learning process of people in real life.
【技术实现步骤摘要】
基于学习自动机的深度神经网络增量式训练方法及系统
本专利技术涉及信息处理领域,具体地,涉及基于学习自动机的深度神经网络增量式训练方法及系统。
技术介绍
神经网络是一种模拟生物大脑神经元的层次化连接结构而设计的机器学习算法,其可以从样本数据中学习潜在的特征变换,实现从输入到输出的非线性映射。近年来,随着大数据及高性能并行运算设备(如通用图形处理器GUGPU)的快速发展,深度神经网络技术得到了广泛研究,并取得了显著成果,在图像分类、目标检测、语音识别甚至棋类游戏等领域不断取得了超越人类的效果。神经网络的基本构成单元是神经元,由特定数量的神经元构成一个神经网络层,并与上一层的神经元相连接。每个神经元的功能是对输入向量通过仿射变换和非线性的激活函数而得到输出值。具体的,用x表示神经元的输入向量,y表示其输出值,则x和y的关系可以描述为y=f(w*x+b),其中权重向量w和偏置值b为可训练的参数,f为可选的非线性激活函数(通常采用sigmoid函数或ReLU函数)。传统的神经网络模型通常由输入层、隐藏层和输出层组成,每一层的神经元都与上一层的所有神经元相连接从而构成全连接的网络结构。而深度神经网络是指更深层的神经网络,通常包含有更多的隐藏层(几十甚至上百层)和更精细复杂的网络连接结构(如卷积核、长短时记忆单元等),因此深度神经网络具有更强大的特征表达能力,可以直接从原始样本数据中学习到针对特定任务的有效的特征模式。用θ表示神经网络模型中所有可训练参数(每层的权重和偏置)的集合,用X表示其输入向量,则输出向量Y=F(X,θ),其中,F表示由网络拓扑结构所形成的从输入到 ...
【技术保护点】
1.一种基于学习自动机的深度神经网络增量式训练方法,其特征在于,包括:原始样本集训练步骤:采用原始训练样本集对深度神经网络模型进行训练;增量样本集训练步骤:对前一次训练样本集进行类别扩充,采用扩充后的训练样本集对前一次训练好的深度神经网络模型进行增量式训练。
【技术特征摘要】
1.一种基于学习自动机的深度神经网络增量式训练方法,其特征在于,包括:原始样本集训练步骤:采用原始训练样本集对深度神经网络模型进行训练;增量样本集训练步骤:对前一次训练样本集进行类别扩充,采用扩充后的训练样本集对前一次训练好的深度神经网络模型进行增量式训练。2.根据权利要求1所述的基于学习自动机的深度神经网络增量式训练方法,其特征在于,所述原始样本集训练步骤包括:模型构建子步骤:构建深度神经网络模型,赋予深度神经网络的每个连接权重一个包含第一行为和第二行为的学习自动机;采样子步骤:学习自动机根据选择概率进行采样,选择第一行为或第二行为;梯度值计算子步骤:从第一训练样本集中抽取样本,计算损失函数对于深度神经网络的网络参数的梯度值,计算梯度值时忽略第二行为的连接;更新子步骤:根据梯度值对深度神经网络的权重和偏置进行更新;交互子步骤:每个学习自动机与深度神经网络交互,若学习自动机对应的当前权重大于第一阈值,则对学习自动机进行奖励,否则进行惩罚;迭代子步骤:从采样子步骤至交互子步骤进行迭代,直至损失函数不能再继续减小,收敛到第一行为的连接为核心连接,收敛到第二行为的连接为边缘连接。3.根据权利要求2所述的权利要求1所述的基于学习自动机的深度神经网络增量式训练方法,其特征在于,所述增量样本集训练步骤包括:稀疏度计算子步骤:计算深度神经网络中每一层连接的稀疏度,若稀疏度小于第二阈值,则在对应层添加随机初始化的神经元,使稀疏度达到第二阈值,其中,在分类层中添加与新增类别数量相等的随机初始化的神经元,重置所有边缘连接的学习自动机状态;迭代训练子步骤:对核心连接采用第一学习速率以及对边缘连接采用第二学习速率进行随机梯度下降的迭代训练,第一学习速率小于第二学习速率。4.根据权利要求2所述的权利要求1所述的基于学习自动机的深度神经网络增量式训练方法,其特征在于,所述第一行为代表当前连接被激活,所述第二行为代表当前连接被休眠。5.根据权利要求3所述的权利要求1所述的基于学习自动机的深度神经网络增量式训练方法,其特征在于,所述梯度值计算子步骤中,采用反向传播算法计算损失函数对于深度神经...
【专利技术属性】
技术研发人员:李生红,郭浩楠,马颖华,陈秀真,
申请(专利权)人:上海交通大学,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。