【技术实现步骤摘要】
一种基于模型结构冗余度的模型剪枝方法及系统
[0001]本专利技术涉及计算机视觉和神经网络
,更具体的说是涉及一种基于模型结构冗余度的模型剪枝方法及系统。
技术介绍
[0002]神经网络是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络是一种非线性统计性数据建模工具,由大量的人工神经元联结进行计算,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。深度神经网络在许多应用场景中取得了巨大成功,包括图像理解、目标检测和自动驾驶车辆。然而,这些成功是有代价的,因为训练和使用它们需要大量的计算和存储费用,成本高昂。
[0003]为了降低深度学习应用程序的成本,直观的方法是减少模型大小。在理想情况下,要使模型结构应尽可能简单,以满足实用要求。为了实现这一目标,机器学习界主要采用模型剪枝方法,模型剪枝基于不同的层次对模型推理的贡献从模型结构中移除冗余的部分,减少模型大小的关键挑战是有效识别模型结构中的冗余部分。现有的模型剪枝技术只能从不同的角度衡量模型的性能,而无法定量衡量剩余的冗余。换句话说,它们无法描述我们获得具有最小冗余的模型的进度。
[0004]本专利技术关注重点是以往剪枝模型不能对冗余准确量化的问题。CN202211264295.4一种基于分布差异的卷积神经网络剪枝方法,通过提取模型中间层特征矩阵,然后结合卷积核权重的L1范数计算卷积层输出的特征矩阵同标签特征之间的分布差异,得到分数,对阈值以下的卷积核进行裁剪;CN202210177728.6一种基于协同演化的深度卷积神 ...
【技术保护点】
【技术特征摘要】
1.一种基于模型结构冗余度的模型剪枝方法,其特征在于,包括以下步骤:S1:训练图像分类模型,作为样本模型;S2:提取模型特征表示,得到样本模型的中间表示,设置模型结构冗余度阈值;S3:计算相邻层的模型结构冗余度;S4:根据计算出的模型结构冗余度和设定的模型结构冗余度阈值对样本模型进行剪枝操作,得到剪枝后模型。2.根据权利要求1所述的一种基于模型结构冗余度的模型剪枝方法,其特征在于,S1中,训练图像分类模型,具体包括以下步骤:S11:选用四个图像数据集,包括CIFAR10、CIFAR100、ImageNet和ImageNet16
‑
120;S12:利用随机梯度下降法作为优化模型,设计模型参数;S13:将获得的集中样本输入优化模型,获取图像分类模型VGGs和ResNets。3.根据权利要求2所述的一种基于模型结构冗余度的模型剪枝方法,其特征在于,设计模型参数,具体为:初始学习率为0.01,批量大小为256,权重衰减为0.0005,动量为0.9。4.根据权利要求1所述的一种基于模型结构冗余度的模型剪枝方法,其特征在于,S2的具体步骤包括:S21:将获取的样本输入参数固定的优化DNN中,神经网络的特征表示:其中N代表样本批量大小,L为层数,C
i
为第i层的通道数,W
i
和H
i
分别为第i层特征映射的宽度和高度;F
i
表示神经网络第i层的特征表示;利用映射函数降维:其中M
i
=C
i
×
W
i
×
H
i
,获得一组特征表示F={F1,F2,
…
,F
L
};f
θ
表示用于降维的映射函数;S22:设置模型结构冗余度阈值μ,μ为人为设置参数。5.根据权利要求1所述的一种基于模型结构冗余度的模型剪枝方法,其特征在于,S3中,计算相邻层的模型结构冗余度,具体包括以下步骤:S31:计算格拉姆矩阵S
i
、S
j
::j=i+1
ꢀꢀꢀꢀ
(5);其中F
T
代表F矩阵的转置,i和k为特征所在层数,S
i
、S
j
为相邻层特征的格拉姆矩阵,S∈R
N
×
...
【专利技术属性】
技术研发人员:宣琦,刘惟清,杨坤霖,陆耀,
申请(专利权)人:杭州市滨江区浙工大网络空间安全创新研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。