一种基于模型稀疏化与权重量化的联邦学习模型压缩方法技术

技术编号：29587403 阅读：27 留言：0更新日期：2021-08-06 19:46

本发明专利技术公开了一种基于模型稀疏化与权重量化的联邦学习模型压缩方法，所述方法包括以下步骤：步骤1，客户端使用本地数据集进行本地模型训练；步骤2，客户端对本地模型训练生成的权重矩阵进行模型稀疏化；步骤3，客户端对稀疏化之后的矩阵进行权重量化；步骤4，客户端将完成压缩后的模型通过无线信道传输到服务器；步骤5，服务器对接收到的权重矩阵进行解压缩，并完成联邦学习聚合。本发明专利技术的优越效果在于有效解决了联邦学习训练过程中的资源不足问题，并通过优化算法提升了联邦学习的训练精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于模型稀疏化与权重量化的联邦学习模型压缩方法
本专利技术属于数据处理领域，尤其涉及一种基于模型稀疏化与权重量化的联邦学习模型压缩方法。
技术介绍
目前，前所未有的数据增长以及计算与并行处理的进步引发了包括了无线通信在内的领域对机器学习的研究兴趣。对于无线通信，由于传统的基于模型的方法不足以捕获现代无线网络日益增长的复杂性和异构性，采用机器学习进行系统设计和分析尤其有吸引力。例如，申请号为2018106746983的专利申请公开了一种基于非对称三元权重量化的深度神经网络模型压缩方法，包括：在深度神经网络训练时，在每一次前向计算之前，将网络的每一层浮点权重量化为非对称的三元值，参数更新阶段使用原始的浮点型网络权重；对训练完成的深度神经网络进行压缩存储。去除深度神经网络的冗余参数，对网络模型进行压缩。申请号为2019102115318的专利申请公开了一种基于Q-Learning算法的自动化模型压缩方法，其通过将深度神经网络的模型性能包括推理时间，模型大小，能耗及准确率作为约束条件，设计可以根据网络结构自动选择模型压缩方法的算法，从而获得性能最优的压缩方案选择。通过这种自动化模型压缩框架在五种不同网络结构下的模型使用。由于管理大规模数据以保持机器学习算法的效率和扩展性是个挑战，在无线网络中，数据是由数十亿个设备生成并分发的，这就需要探索能够有效处理分布式数据集的解决方案。传统的集中式机器学习方案不适合此类情景是因为它们需要在中央实体中传输和处理数据，由于私有数据的不可访问性，在实践中无法实现。因此，分布式学习解...

【技术保护点】
1.一种基于模型稀疏化与权重量化的联邦学习模型压缩方法，其特征在于，包括以下步骤：/n步骤1，客户端使用本地数据集进行本地模型训练：/n各个客户端根据其本地数据集独立地进行模型更新，在任意一个客户端，使用随机梯度下降(SGD)算法减少本地模型的损失函数，本地模型采用如下公式(1)进行更新：/n

【技术特征摘要】
1.一种基于模型稀疏化与权重量化的联邦学习模型压缩方法，其特征在于，包括以下步骤：
步骤1，客户端使用本地数据集进行本地模型训练：
各个客户端根据其本地数据集独立地进行模型更新，在任意一个客户端，使用随机梯度下降(SGD)算法减少本地模型的损失函数，本地模型采用如下公式(1)进行更新：

公式(1)中，ωt，m与ωt-1，m分别表示客户端Um在t次与t-1次迭代中的本地模型更新结果；Dt，m表示用于更新ωt，m的训练数据集，数据集从客户端Um的本地数据集Dm中随机生成；ηt为第t次迭代的学习率；为损失函数F(ωt-1，m，Dt，m)关于ωt-1，m的梯度；
步骤2，客户端对本地模型训练生成的权重矩阵进行模型稀疏化，对本地模型训练生成的权重ωt，m进行模型稀疏化：
st，m＝At，mωt，m……(2)，
公式(2)中，st，m表示对ωt，m模型稀疏化后得到的权重向量，At，m表示d×d的稀疏矩阵，并采取了对稀疏矩阵At，m的优化算法；
步骤3，客户端对稀疏化之后的矩阵进行权重量化：
在模型稀疏化完成后对权重向量st，m中的每一个元素进行独立的量化，量化后的参数向量通过如下公式(3)获得：
xt，m＝st，m+qt，m……(3)，
公式(3)中，qt，m表示一个d×1的量化噪声向量，qt，m～CN(0，Ωt，m)，Ωt，m表示协方差矩阵，独立量化后的qt，m的各元素之间保持独立，Ωt，m表示为
步骤4，客户端将完成压缩后的模型通过无线信道传输到服务器：
客户端Um将压缩后的权重向量xt，m通过无线信道传输到服务器，假设信道为平坦衰落模型，则服务器接收到的权重向量yt，m能够表示为以下公式(4)：
yt，m＝ht，mxt，m+nt，m……(4)
公式(4)中，ht，m表示客户端Um与服务器之间的平坦信道衰落，nt，m表示服务器端的加性高斯白噪声；
步骤5，服务器对接收到的权重矩阵进行解压缩并完成联邦学习聚合：
通过解压缩将接收到的权重向量yt，m还原为本地模型更新后地权重，本发明所述方法采用最小均方误差(MMSE)准则进行解压缩，解压缩结果通过如下公式(5)得到：

公式(5)中，Dt，m为d×d的解压缩矩阵，实现对yt，m的解稀疏化，C表示由所有可能的量化参数向量组成的集合，并采取对解稀疏矩阵Dt，m的优化算法，在完成解压缩之后，用所有解压缩得到的权重向量进行全局更新，之后服务器将全局更新后的权重向量返回各个客户端，完成联邦学习的一次迭代过程。

2.根据权利要求1所述的一种基于模型稀疏化与权重量化的联邦学习模型压缩方法，其特征在于，所述步骤2中，步骤2中，所述损失函数F(ωt，m，Dt，m)通过以下公式计算：

公式(6)中，l(ωt，m；x)表示属于Dt，m的数据元素x的损失值，Nt，m表示Dt，m的大小。
<...

【专利技术属性】
技术研发人员：赵中原，王屹东，纪晓东，陈柏平，周惠宣，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人