一种基于塔克分解与主成分分析的卷积神经网络压缩方法技术

技术编号：21659295 阅读：52 留言：0更新日期：2019-07-20 05:47

一种基于塔克分解与主成分分析法结合的卷积神经网络压缩方法，在选择秩时，不仅利用当前层的权重张量，还使用了相邻两层的权重张量，各层之间的压缩不再是完全独立的。相邻层之间的信息使秩的选择更加合理，从而保证压缩的有效性。之后，为了解决基于塔克分解的压缩方法使网络深度增加的问题，将塔克分解与主成分分析法相结合对每个卷积层的权重张量进行压缩，从而保持原有的网络深度，避免了网络层数大量增加带来的梯度消失等问题。本发明专利技术将相邻层间的信息纳入考虑，在不增加网络深度的前提下，实现了网络的压缩，且压缩后的网络仍能保持较好的效果。

A Compression Method of Convolutional Neural Network Based on Tucker Decomposition and Principal Component Analysis

全部详细技术资料下载

【技术实现步骤摘要】
一种基于塔克分解与主成分分析的卷积神经网络压缩方法
本专利技术涉及神经网络与机器学习领域，特别涉及一种基于塔克分解与主成分分析的卷积神经网络压缩方法。
技术介绍
近些年来人工神经网络在众多领域得到了广泛的运用。在民用应用领域的应用，如人脸识别、语音识别、图像识别与理解、目标跟踪、实时语言翻译、市场分析、决策优化、物资调运等等；在军用应用领域的应用，如雷达、声纳的多目标识别与跟踪，战场管理和决策支持系统，军用机器人控制各种情况、信息的快速录取、分类与查询等。人工神经网络的核心技术是深度非线性模型的学习，即深度神经网络的学习。其中卷积神经网络已经在人脸识别、图像分类、目标检测、目标跟踪等众多计算机视觉应用得到了广泛的应用，如Vggnet(K.SimonyanandA.Zisserman.Verydeepconvolutionalnetworksforlarge-scaleimagerecognition.InternationalConferenceonLearningRepresentations(ICLR),2015.1,6,8)和Alexnet(A.Krizhevsky,I.Sutskever,andG.E.Hinton.ImageNetclassificationwithdeepconvolutionalneuralnetworks.InAdvancesinNeuralInformationProcessingSystems(NIPS),pages1097–1105,2012.1,6)在图像分类数据集ImageNet(J.Deng,A.Berg,S.S...

【技术保护点】
1.一种基于塔克分解与主成分分析的卷积神经网络压缩方法，其特征在于，包括以下步骤：步骤1：获取人脸识别、目标检测或图像分类目标任务中使用的卷积神经网络模型，提取其中每一层的权重张量；步骤2：利用变分贝叶斯矩阵分解，对每一个卷积层的权重张量进行联合秩选择，得到联合秩R3和R4；步骤3：用所述的联合秩R3和R4，对卷积层权重张量进行塔克分解得到核张量C、矩阵U

【技术特征摘要】
1.一种基于塔克分解与主成分分析的卷积神经网络压缩方法，其特征在于，包括以下步骤：步骤1：获取人脸识别、目标检测或图像分类目标任务中使用的卷积神经网络模型，提取其中每一层的权重张量；步骤2：利用变分贝叶斯矩阵分解，对每一个卷积层的权重张量进行联合秩选择，得到联合秩R3和R4；步骤3：用所述的联合秩R3和R4，对卷积层权重张量进行塔克分解得到核张量C、矩阵U(3)与矩阵U(4)，对矩阵U(3)与矩阵U(4)进行降维处理，然后将降维后的矩阵与塔克核张量C相乘，从而得到降维后的权重张量，实现卷积层的压缩；步骤4：利用训练数据，对压缩后的神经网络进行训练，得到训练完成的压缩网络，应用到目标任务中，实现人脸识别、目标检测或图像分类。2.根据权利要求1所述的一种基于塔克分解与主成分分析的卷积神经网络压缩方法，其特征在于，步骤2中，设卷积层的输入是大小为H×W×S的张量X，输出是大小为H′×W′×T的张量Y，卷积方程如下：其中，hm＝(h′-1)Δ+m-Pwn＝(w′-1)Δ+j-P其中，K是大小为Di×Di×Si×Ti的权重张量，Δ是卷积步长，P是填充的大小，S是输入的通道数目，T是输出的通道数目，i表示第i个卷积层，D是卷积核尺寸。3.根据权利要求2所述的一种基于塔克分解与主成分分析的卷积神经网络压缩方法，其特征在于，步骤2中，联合秩R3和R4通过以下过程得到：步骤2.1：将第i层的权重张量Ki改变形状和大小，得到大小为Si×(Di×Di×Ti)的矩阵Kia和大小为Ti×(Di×Di×Si)的矩阵Kib；步骤2.2：将矩阵Kia、Kib分别与矩阵Ki-1b，Ki-1a沿最后一维连接，得到大小为Si×(Di×Di×Ti+Di-1×Di-...

【专利技术属性】
技术研发人员：刘静，张煜东，吕鑫，苏立玉，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人