【技术实现步骤摘要】
联邦学习模型剪枝方法、装置及非易失性存储介质
[0001]本申请涉及模型训练领域,具体而言,涉及一种联邦学习模型剪枝方法、装置及非易失性存储介质。
技术介绍
[0002]目前相关技术中在对联邦学习模型进行训练时,为了解决在训练过程中需要传递的模型参数量过大的问题,会采用自动化搜索剪枝方法来对模型参数进行压缩。但是相关技术中的自动化搜索剪枝方法是采用全局信息引导搜索来确定的每层剪枝比列,搜索空间较大,搜索效率低。
[0003]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本申请实施例提供了一种联邦学习模型剪枝方法、装置及非易失性存储介质,以至少解决由于相关技术依据全局信息确定每层剪枝比例造成的在确定剪枝比例时搜索空间大且搜索效率低的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种联邦学习模型剪枝方法,包括:确定目标学习分支中的每个卷积层中各个通道对应的剪枝指标,并依据各个通道对应的剪枝指标确定每个卷积层对应的剪枝指标顺序,其中,目标学习分支为联邦学习模型中的任意一个学习分支模型,并且目标学习分支通过本地存储的数据集进行训练,剪枝指标用于表示各个通道在每个卷积层中的重要程度;确定目标学习分支的压缩率,并依据压缩率和每个卷积层对应的剪枝指标顺序确定目标学习分支的通道掩码数据,其中,压缩率用于确定每个卷积层中选择的通道数量;依据通道掩码数据,对目标学习分支的第一模型参数进行通道掩码运算,得到第二模型参数,其中,第二模型参数为剪枝后的目标学习分支的模型参数 ...
【技术保护点】
【技术特征摘要】
1.一种联邦学习模型剪枝方法,其特征在于,包括:确定目标学习分支中的每个卷积层中各个通道对应的剪枝指标,并依据所述各个通道对应的剪枝指标确定所述每个卷积层对应的剪枝指标顺序,其中,所述目标学习分支为所述联邦学习模型中的任意一个学习分支模型,并且所述目标学习分支通过本地存储的数据集进行训练,所述剪枝指标用于表示所述各个通道在所述每个卷积层中的重要程度;确定所述目标学习分支的压缩率,并依据所述压缩率和所述每个卷积层对应的所述剪枝指标顺序确定所述目标学习分支的通道掩码数据,其中,所述压缩率用于确定所述每个卷积层中选择的通道数量;依据所述通道掩码数据,对所述目标学习分支的第一模型参数进行通道掩码运算,得到第二模型参数,其中,所述第二模型参数为剪枝后的所述目标学习分支的模型参数。2.根据权利要求1所述的联邦学习模型剪枝方法,其特征在于,所述确定目标学习分支中的每个卷积层中各个通道对应的剪枝指标的步骤包括:在本地存储的数据集中随机选择部分数据,得到第一训练数据集;将所述第一训练数据集输入到所述目标学习分支中,并记录所述目标学习分支中的各个卷积层对应的特征图;计算所述每个卷积层中各个通道的通道方向上的所述特征图的绝对值,得到第一目标统计矩阵,并计算所述每个卷积层中各个通道的通道方向上的所述特征图在缺少目标通道的情况下的绝对值,得到第二目标统计矩阵,其中,所述目标通道为所述通道方向对应的通道;对所述第一目标统计矩阵和所述第二目标统计矩阵进行二范数归一化后作差,得到所述各个通道对应的所述剪枝指标。3.根据权利要求1所述的联邦学习模型剪枝方法,其特征在于,所述确定所述目标学习分支的压缩率,并依据所述压缩率和所述每个卷积层对应的所述剪枝指标顺序得到所述目标学习分支的通道掩码数据的步骤包括:依据所述压缩率和所述每个卷积层对应的所述剪枝指标顺序对所述每个卷积层中的通道进行筛选,得到筛选结果,其中,所述压缩率用于确定筛选后的所述通道的数量;依据所述筛选结果和所述剪枝指标顺序,得到所述通道掩码数据。4.根据权利要求3所述的联邦学习模型剪枝方法,其特征在于,所述依据所述压缩率和所述每个卷积层对应的所述剪枝指标顺序对所述每个卷积层中的通道进行筛选,得到筛选结果的步骤包括:第一步,采用均匀剪枝策略和所述压缩率生成初始解,并将所述初始解作为当前解,以及确定初始衰减步长,并将所述初始衰减步长作为当前衰减步长,其中,所述初始解中包括在采用均匀剪枝策略下所述每个卷积层中保留的通道数量;第二步,依据所述当前解和所述剪枝指标顺序,确定所述每个卷积层中的各个通道对应的通道掩码值,其中,所述每个卷积层中的各个通道对应的通道掩码值为第一掩码数据;第三步,将所述第一掩码数据和第二训练数据集输入到所述目标学习分支中,并计算所述目标学习分支的第一损失值,其中,所述第二训练数据集是在本地存储的数据集中随机选择得到的数据集;第四步,依据所述当前解和所述衰减步长,确定局部邻域解;
第五步,依据所述局部邻域解和所述剪枝指标排序得到第二掩码数据,并将所述第二训练数据集和所述第二掩码数据输入到所述目标学习分支中,并计算所述目标学习分支的第二损失值,其中,每个所述局部邻域解均对应一个第二掩码数据;第六步,在存在所述第二损失值小于所述第一损失值的情况下,确定目标邻域解,并将所述目标邻域解作为所述当前解,跳转到第二步,其中,所述目标邻域解为对应的所述第二损失值最小的所述局部邻域解;第七步,令所述当前衰减步长等于...
【专利技术属性】
技术研发人员:金键,曾西平,袁彤彤,
申请(专利权)人:北京泰尔英福科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。