一种神经网络压缩方法、装置、电子设备及存储介质制造方法及图纸

技术编号：20567020 阅读：55 留言：0更新日期：2019-03-14 09:38

本申请提供一种神经网络压缩方法、装置、电子设备及存储介质，用于解决现有技术中在卷积神经网络模型同等精度损失的情况下，获取的压缩比非常小的问题。该方法包括：从多个复杂网络中的筛选出原始网络，并对原始网络进行裁剪，获得简单网络；将多个无标签数据和多个有标签数据输入多个复杂网络模型，获得多个输出向量；对多个输出向量进行第一融合和归一化处理，获得一个概率向量，概率向量包括：人工标注向量和模型标注向量；将人工标注向量与多个有标签数据进行第二融合计算，获得融合标签向量；将融合标签向量和模型标注向量进行合并，获得训练集；利用训练集对简单网络进行训练，获得训练后的简单模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种神经网络压缩方法、装置、电子设备及存储介质
本申请涉及机器学习的
，尤其涉及一种神经网络压缩方法、装置、电子设备及存储介质。
技术介绍
随着以卷积神经网络(ConvolutionalNeuralNetwork，CNN)为代表深度学习技术的蓬勃发展和以图形处理器(GraphicsProcessingUnit，GPU)为代表计算硬件的迭代更新，配合大规模数据的积累。深度学习广泛应用在诸多场合。针对不同的问题除了收集大规模的训练数据以期待获得更好结果之外，CNN网络也变的越来越深，由出现之初的几层网络数十个神经元发展到如今的成百上千的网络层以及数以千万计的神经元。目前在CNN网络的压缩工作中，其思路是先训练一个效果很好复杂的模型，然后采用诸如矩阵正则化、霍夫曼编码等方式对每层网络的权重进行量化编码，从而实现体积上的压缩。该方法使得CNN网络模型的尺寸有所变小，同时其模型的精度也有所损失且获取的压缩比还非常小。因此，现有技术中存在着在卷积神经网络模型同等精度损失的情况下，获取的压缩比非常小的问题。
技术实现思路
有鉴于此，本申请提供一种神经网络压缩方法、装置、电子设备及存储介质，用于解决现有技术中在卷积神经网络模型同等精度损失的情况下，获取的压缩比非常小的问题。本申请提供了的一种神经网络压缩方法，所述方法包括：从多个复杂网络中的筛选出原始网络，并对所述原始网络进行裁剪，获得简单网络；将多个无标签数据和多个有标签数据输入多个复杂网络模型，获得多个输出向量，其中，所述多个复杂网络模型由所述多个复杂网络通过输入所述多个有标签数据训练获得；对所述多个输出向量进行第一...

【技术保护点】
1.一种神经网络压缩方法，其特征在于，所述方法包括：从多个复杂网络中的筛选出原始网络，并对所述原始网络进行裁剪，获得简单网络；将多个无标签数据和多个有标签数据输入多个复杂网络模型，获得多个输出向量，其中，所述多个复杂网络模型由所述多个复杂网络通过输入所述多个有标签数据训练获得；对所述多个输出向量进行第一融合和归一化处理，获得一个概率向量，所述概率向量包括：人工标注向量和模型标注向量；将所述人工标注向量与所述多个有标签数据进行第二融合计算，获得融合标签向量；将所述融合标签向量和所述模型标注向量进行合并，获得训练集；利用所述训练集对所述简单网络进行训练，获得训练后的简单模型。

【技术特征摘要】
1.一种神经网络压缩方法，其特征在于，所述方法包括：从多个复杂网络中的筛选出原始网络，并对所述原始网络进行裁剪，获得简单网络；将多个无标签数据和多个有标签数据输入多个复杂网络模型，获得多个输出向量，其中，所述多个复杂网络模型由所述多个复杂网络通过输入所述多个有标签数据训练获得；对所述多个输出向量进行第一融合和归一化处理，获得一个概率向量，所述概率向量包括：人工标注向量和模型标注向量；将所述人工标注向量与所述多个有标签数据进行第二融合计算，获得融合标签向量；将所述融合标签向量和所述模型标注向量进行合并，获得训练集；利用所述训练集对所述简单网络进行训练，获得训练后的简单模型。2.如权利要求1所述的方法，其特征在于，所述从多个复杂网络中的筛选出原始网络，包括：用预设数据对所述多个复杂网络进行训练，获得多个复杂网络模型；根据所述多个复杂网络模型获得原始网络。3.如权利要求2所述的方法，其特征在于，所述用预设数据对所述多个复杂网络进行训练，获得多个复杂网络模型，包括：获得多个复杂网络，复杂网络为不同结构的神经网络或将多样性数据训练后获得的复杂网络；利用多个有标签数据对所述多个复杂网络进行训练，获得多个复杂网络模型。4.如权利要求2所述的方法，其特征在于，所述根据所述多个复杂网络模型获得原始网络，包括：将标准的测试数据集对所述多个复杂网络模型进行准确率测试，并将所述多个复杂网络模型中的准确率最高的复杂网络模型作为原始网络模型；从所述多个复杂网络中获得与所述原始网络模型对应的复杂网络，作为原始网络。5.如权利要求1所述的方法，其特征在于，所述对所述原始网络进行裁剪获得简单网络，包括：减少所述原始网络的网络层的数量；或/和减少所述原始网络的网络层的参数。6.如权利要求1所述的方法，其特征在于，所述将所述人工标注向量与所述多个有标签数据...

【专利技术属性】
技术研发人员：周曦，黄殿，
申请(专利权)人：重庆中科云丛科技有限公司，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人