【技术实现步骤摘要】
一种基于差分隐私的个性化联邦学习、识别方法及系统
[0001]本专利技术涉及计算机科学与
,尤其涉及一种基于差分隐私的个性化联邦学习、识别方法及系统。
技术介绍
[0002]随着数据驱动智能应用的快速发展,机器学习在医疗卫生、智能交通和金融管理等众多行业中已被广泛应用,但它也面临着无法为所有用户提供稳健且高效的服务以及数据难以做到充分共享的难题。而联邦学习(Federated Learning,FL)作为一种极具潜力的解决方法应运而生,它是一种数据访问受限的分布式机器学习框架。在联邦学习中,分布式客户端根据自己的私有数据训练机器学习模型,并借助参数服务器仅共享训练得到的梯度,以此协作训练全局联邦模型,整个过程实现了训练数据去中心化。联邦学习体现了集中收集和数据最小化原则,避免用户将自己的数据暴露给企业或其他参与方,可以有效减少传统集中式机器学习带来的许多系统性隐私风险和开销问题。
[0003]虽然联邦学习能解决数据孤岛问题而被广泛应用,但它仍然面临许多挑战。在实际应用场景中,往往存在网络设备的差异使数据分布不均匀造成数据非独立同分布(non
‑
Independent and Identically Distribute,non
‑
IID)的情况,而在这种情况下联邦学习的全局模型很难对每个客户端数据进行较好概括,导致全局模型无法为各客户端任务提供良好的性能。例如,在图像识别应用中,由于每个移动端设备(智能摄像头)收集的数据存在地理差异和时间差异,那么模型对数据预测将会造 ...
【技术保护点】
【技术特征摘要】
1.一种基于差分隐私的个性化联邦学习方法,其特征在于,包括:步骤1:各客户端采用Moreau envelope函数对本地模型进行双层优化,每个客户端的本地模型根据自己所拥有的数据进行个性化采样训练,获得所述本地模型参数,再采用局部差分隐私对所述本地模型参数进行扰动后并将其上传至服务器;步骤2:服务器接收所有客户端的本地模型参数,执行聚合操作得到全局参数;步骤3:采用全局差分隐私对全局参数添加噪声后,向所有客户端下发添加噪声后的全局参数;步骤4:所有客户端依据接收到最新的全局参数进行更新各自的本地模型,返回步骤1,重复上述步骤,直到各客户端的本地模型收敛,得到各客户端基于差分隐私的个性化本地模型。2.根据权利要求1所述的方法,其特征在于,所述采用全局差分隐私对全局参数添加噪声的标准方差如下:其中,σ
G
表示采用全局差分隐私对全局参数添加的噪声标准方差,σ
B
表示采用局部差分隐私对所述本地模型参数添加的噪声的标准方差;σ
A
=cTΔs
G
/ε,σ
B
=cRΔs
B
/ε,σ
A
、c为中间变量;其中,C表示w
i
边界的裁剪阈值,||w
i
||≤C,为正整数的设定值,w
i
表示第i个客户端上传的模型参数;表示第i个客户端拥有的数据集,p
max
表示最大数据集与总数据集的比值,总数据集为所有客户端数据集的总和,T表示全局迭代次数,R表示客户端的本地模型迭代次数,ε表示隐私预算,取值越小安全性更高,m表示最小数据集的大小,Δs
B
表示上行信道中的局部敏感度,Δs
G
表示全局敏感度,δ表示失败概率。3.根据权利要求2所述的方法,其特征在于,所述全局敏感度是利用以下两个公式获得:得:其中,表示对第i个客户端的数据进行聚合操作后的敏感度,w为服务器广播给客户端的聚合参数,p
i
表示第i个客户端数据大小与总数据大小的比值,w
i
表示第i个客户端上传的模型参数,和分别表示客户端i对数据集采样训练的模型参数,表示与仅有一条记录不同的相邻数据集,N表示客户端的总数,p
max
=max(p
i
)。4.根据权利要求1所述的方法,其特征在于,所述步骤2中执行聚合操作是指采用
FedAvg算法进行全局聚合其中,表示第i个客户端在全局迭代第t轮本地迭代第R轮时的模型参数,N表示客户端的总数。5.一种基于差分隐私的个性化联邦学习的识别方法,其特征在于,应用权利要求1
‑
4任一项所述的一种基于差分隐私的个性化联邦学习方法,所有参与的客户端获得更新完成的本地模型,利用所述客户端的本地模型对自身采集的新数据进行识别。6.一种基于差分隐私的个性化联邦学习系统,其特征在于,包括:个性化训练模块:各客户端采用Moreau envelope函数对本地模型...
【专利技术属性】
技术研发人员:张少波,张激勇,梁伟,朱更明,
申请(专利权)人:湖南科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。