当前位置: 首页 > 专利查询>湖南大学专利>正文

通道剪枝方法、目标检测方法及遥感图像车辆检测方法技术

技术编号:34573372 阅读:20 留言:0更新日期:2022-08-17 13:05
本发明专利技术公开了一种通道剪枝方法,包括确定目标网络模型;训练目标网络模型得到基础网络模型;将基础网络模型的卷积层等价解耦得到基础网络解耦模型;训练基础网络解耦模型得到解耦模型;确定最终能够被压缩的通道和保留的通道;对解耦模型进行等价合并得到通道剪枝后的网络模型,完成最终的通道剪枝。本发明专利技术还公开了一种包括所述通道剪枝方法的目标检测方法,以及包括所述目标检测方法的遥感图像车辆检测方法。本发明专利技术将模型中的卷积层等价解耦为原卷积和结构卷积的级联,分开训练并等价合并为原网络,最后根据结构卷积中的参数进行通道的裁剪;因此本发明专利技术方法不仅能够保持模型原有精度,而且压缩率高、可靠性好。可靠性好。可靠性好。

【技术实现步骤摘要】
通道剪枝方法、目标检测方法及遥感图像车辆检测方法


[0001]本专利技术属于数字信号处理领域,具体涉及一种通道剪枝方法、目标检测方法及遥感图像车辆检测方法。

技术介绍

[0002]随着经济技术的发展和人们生活水平的提高,目标检测技术已经广泛应用于人们的生产和生活当中,给人们的生产和生活带来了无尽的便利。因此,保证目标检测的精确性和快速性,就成为目标检测技术的研究重点。
[0003]现阶段,采用无人机进行目标检测的方式已经开始大范围使用。与离线处理的目标检测流程不同,无人机等边缘设备上的目标检测需要实时检测所拍摄图像中的目标。但平台受计算能力、内存与功耗限制,一般基于深度学习的目标检测方法无法实现实时部署,因此实现高精度且轻量级的目标检测,对于无人机等边缘设备而言,就显得尤为重要。
[0004]为了满足深度神经网络在端侧的实时部署,研究人员对模型压缩方法进行了大量研究,意欲通过简化模型以减少模型的计算量与存储量,同时不会对模型的性能产生影响。通道剪枝方法是一种重要的模型压缩方法,不需要重新定义模型的结构,通过直接删除冗余通道来减少模型大小,从而减少深度神经网络的训练时间,加快模型的推理速度。通道剪枝方法为深度学习的目标检测方法部署在边缘设备提供了可能。
[0005]然而,深度神经网络的性能与卷积的通道数息息相关,卷积通道经过修剪后,会一定程度上影响模型的性能,因此需要在修剪程度和性能之间进行权衡。在传统模型剪枝的训练过程中,每个参数同时参与训练与剪枝,即精度训练与剪枝训练耦合;但是,一方面,剪枝训练中引入的权重惩罚项(如结构稀疏性等)会使模型的优化目标发生变化,深度神经网络在训练过程中的性能会严重下降;另一方面,若为了保持模型的性能降低剪枝约束,剪枝程度不能得到保证,则无法获得高压缩率的剪枝模型。

技术实现思路

[0006]本专利技术的目的之一在于提供一种压缩率高、可靠性好且能够保持模型原有精度的通道剪枝方法。
[0007]本专利技术的目的之二在于提供一种包括了所述通道剪枝方法的目标检测方法。
[0008]本专利技术的目的之三在于提供一种包括了所述目标检测方法的遥感图像车辆检测方法。
[0009]本专利技术提供的这种通道剪枝方法,包括如下步骤:S1. 确定目标网络模型;S2. 获取训练数据集和损失函数,并采用获取的训练数据集和损失函数对步骤S1确定的目标网络模型进行训练,得到基础网络模型;S3. 将步骤S2得到的基础网络模型的卷积层进行等价解耦,得到基础网络解耦模型;
S4. 采用步骤S2获取的训练数据集和损失函数,对步骤S3得到的基础网络解耦模型进行训练,得到解耦模型;S5. 根据步骤S4得到的解耦模型,确定最终能够被压缩的通道和保留的通道;S6. 根据步骤S5确定的能够被压缩的通道和保留的通道,对步骤S4得到的解耦模型进行等价合并,得到通道剪枝后的网络模型,完成最终的目标网络模型的通道剪枝。
[0010]步骤S2所述的获取训练数据集,具体包括如下步骤:获取训练图片;对获取的训练图片,进行随机多尺度变换;变换后,在按照设定概率进行随机左右翻转;最后,通过补灰度值的方式,将图片大小进行统一;将图片整理为统一格式:统一格式为(n,x,y,w,h),其中n为目标类别;(x,y)为目标框相对长宽归一化后的中心坐标;(w,h)为归一化后目标框的宽度和高度。
[0011]步骤S3所述的将步骤S2得到的基础网络模型的卷积层进行等价解耦,得到基础网络解耦模型,具体包括如下步骤:将步骤S2得到的基础网络模型W的第c个卷积层w
c
,等价解耦为级联的原卷积层w
c
和结构卷积w
e
;其中,结构卷积w
e
为1*1核的卷积层;结构卷积w
e
的初始权重为d
o
*d
o
的单位矩阵,d
o
为原卷积层w
c
的输出通道数。
[0012]为了加快数据处理流程,将结构卷积w
e
平移至原卷积层w
c
后的批归一化层。
[0013]步骤S4所述的采用步骤S2获取的训练数据集和损失函数,对步骤S3得到的基础网络解耦模型进行训练,得到解耦模型,具体包括如下步骤:A. 采用步骤S2获取的训练数据集和损失函数,设定学习率,并对步骤S3得到的基础网络解耦模型再次进行训练;训练时,前N轮正常训练;N轮过后,按照结构卷积的参数大小排序,选择需要被压缩的通道,对结构卷积对应的参数施加额外的惩罚梯度;B. 结构卷积的参数更新为,D为结构卷积层的卷积核通道数;然后,通过结构卷积的参数,采用如下算式计算原卷积第d个通道的通道重要性I
d
:式中为结构卷积各通道上第d位置的参数;C. 选择需要被压缩的通道数M:初始时M=0;从第N轮开始,每X个训练批次后,M增加Y,直至达到预设的通道压缩比;同时,选择通道时保证每个卷积的通道数量不低于设定值S;其中,X、Y和S均为设定的正整数,且;D. 卷积参数的更新过程为,其中为更新后的卷积参数,W为更新前的卷积参数,l为学习率,G为损失函数对卷积的回传梯度;在结构卷积中,对于不需要被压缩的通道,其参数更新方式与原卷积参数更新方式相同;对于需要被压缩的通道,更改其梯度更新方式,对其施加额外的惩罚梯度,其参数更新方式为,其中Q为结构卷积更新前的参数,为结构卷积更新后的参数,为施加的惩罚梯度;为惩罚因子,且;,为符号函数且

[0014]步骤S5所述的根据步骤S4得到的解耦模型,确定最终能够被压缩的通道和保留的通道,具体包括如下步骤:利用结构卷积的参数计算原卷积各通道的通道重要性,其中第I条通道的通道重要性为I
d
;若原卷积各通道的重要性I
d
满足,其中k是修剪阈值且k=0.01,则认定原卷积对应的通道为被裁减通道,裁剪后不会降低模型性能。
[0015]步骤S6所述的根据步骤S5确定的能够被压缩的通道和保留的通道,对步骤S4得到的解耦模型进行等价合并,具体包括如下步骤:a.将卷积层和批归一化层的计算算式合并,得到,式中x为输入特征,y为输入特征经过卷积层与批归一化层后的输出,w为卷积层的权重参数, b为卷积层的偏置参数,为批归一化层的放缩系数,为批归一化层的均值,为批归一化层的标准差,为一个设定的极小值取,为批归一化层的偏移系数,*为卷积运算符;b. 将合并后的计算式整理为卷积的计算格式,得到,所对应的卷积为新卷积;c. 采用如下算式计算步骤b得到的新卷积的权重和偏置:采用如下算式计算步骤b得到的新卷积的权重和偏置:式中为新卷积的权重参数;为新卷积的偏置参数,*为卷积运算符;d. 将步骤b得到的新卷积与结构卷积合并,并计算合并后的卷积层的权重和偏置:置:式中为合并后的卷积层的权重;w
Q
为结构卷积的权重;w为原卷积的权重;为合并后的卷积层的偏置;b为原卷积的偏置,*为卷积运算符;e. 步骤d合并后的卷积层中,若卷积层本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种通道剪枝方法,包括如下步骤:S1. 确定目标网络模型;S2. 获取训练数据集和损失函数,并采用获取的训练数据集和损失函数对步骤S1确定的目标网络模型进行训练,得到基础网络模型;S3. 将步骤S2得到的基础网络模型的卷积层进行等价解耦,得到基础网络解耦模型;S4. 采用步骤S2获取的训练数据集和损失函数,对步骤S3得到的基础网络解耦模型进行训练,得到解耦模型;S5. 根据步骤S4得到的解耦模型,确定最终能够被压缩的通道和保留的通道;S6. 根据步骤S5确定的能够被压缩的通道和保留的通道,对步骤S4得到的解耦模型进行等价合并,得到通道剪枝后的网络模型,完成最终的目标网络模型的通道剪枝。2.根据权利要求1所述的通道剪枝方法,其特征在于步骤S2所述的获取训练数据集,具体包括如下步骤:获取训练图片;对获取的训练图片,进行随机多尺度变换;变换后,在按照设定概率进行随机左右翻转;最后,通过补灰度值的方式,将图片大小进行统一;将图片整理为统一格式:统一格式为(n,x,y,w,h),其中n为目标类别;(x,y)为目标框相对长宽归一化后的中心坐标;(w,h)为归一化后目标框的宽度和高度。3.根据权利要求2所述的通道剪枝方法,其特征在于步骤S3所述的将步骤S2得到的基础网络模型的卷积层进行等价解耦,得到基础网络解耦模型,具体包括如下步骤:将步骤S2得到的基础网络模型W的第c个卷积层w
c
,等价解耦为级联的原卷积层w
c
和结构卷积w
e
;其中,结构卷积w
e
为1*1核的卷积层;结构卷积w
e
的初始权重为d
o
*d
o
的单位矩阵,d
o
为原卷积层w
c
的输出通道数。4.根据权利要求3所述的通道剪枝方法,其特征在于为了加快数据处理流程,将结构卷积w
e
平移至原卷积层w
c
后的批归一化层。5.根据权利要求4所述的通道剪枝方法,其特征在于步骤S4所述的采用步骤S2获取的训练数据集和损失函数,对步骤S3得到的基础网络解耦模型进行训练,得到解耦模型,具体包括如下步骤:A. 采用步骤S2获取的训练数据集和损失函数,设定学习率,并对步骤S3得到的基础网络解耦模型再次进行训练;训练时,前N轮正常训练;N轮过后,按照结构卷积的参数大小排序,选择需要被压缩的通道,对结构卷积对应的参数施加额外的惩罚梯度;B. 结构卷积的参数更新为,D为结构卷积层的卷积核通道数;然后,通过结构卷积的参数,采用如下算式计算原卷积第d个通道的通道重要性I
d
:式中为结构卷积各通道上第d位置的参数;C. 选择需要被压缩的通道数M:初始时M=0;从第N轮开始,每X个训练批次后,M增加Y,直至达到预设的通道压缩比;同时,选择通道时保证每个卷积的通道数量不低于设定值S;

【专利技术属性】
技术研发人员:方乐缘朱定舜吴洁
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1