基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法技术

技术编号：29313837 阅读：11 留言：0更新日期：2021-07-17 02:31

本发明专利技术公开了一种基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法，设有中央服务器和若干个客户端，对若干个客户端的本地模型进行N轮训练并进行添加噪声后上传至中央服务器，对中央服务器的全局模型进行迭代训练。本发明专利技术不仅可以有效防止攻击者从客户端提交的训练模型参数中逆向腿短得到客户端参与者信息，同时还可以解决因为添加噪声导致的数据可用性下降的问题。通过私有化梯度之间的瑞丽距离计算噪声分布下的隐私预算，寻求隐私预算和识别准确率最佳的噪声分布进行添加，以实现隐私与性能的最佳平衡点。隐私与性能的最佳平衡点。隐私与性能的最佳平衡点。

全部详细技术资料下载

【技术实现步骤摘要】
基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法

[0001]本专利技术涉及数据安全领域，尤其是指基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法。

技术介绍

[0002]联邦学习最早由McMahan等人在2016年提出：“我们之所以将我们的方法称为联邦学习，因为学习任务是通过由中央服务器协调的参与设备的松散联邦来解决的”。在联邦学习中，参与者通过接收当前最新的全局模型并在本地利用自身的数据集对全局模型进行迭代训练。训练完成后，将得到的本地模型参数上传给中央服务器。中央服务器对接收到的模型参数聚合得到新一轮的全局模型参数，因此联邦学习中将整个机器学习流程分解为最小的模块化单元，通过数据最小化为参与的用户提供一定程度上的隐私保护。参与者将训练完成的模型参数提交给中央服务器而不是提交原始数据。这样一来，原始数据保留在参与者本地而不是上传给中央服务器，在最大程度上防止参与者隐私泄露。
[0003]虽然联邦学习通过聚合多方训练模型参数而非原始数据集的方式，在最大程度上保护了用户数据隐私安全，但即便如此，攻击者仍可能通过某些手段可以从联邦学习训练过程中传输的模型参数信息中获取某些敏感信息，攻击者可以通过逆向学习的方式推断部分甚至全部数据。在文献“Deep leakage from gradients”中的研究表明，攻击者可以在无需任何有关训练集的先验知识的前提下从共享的模型参数中推断出标签并恢复原始训练样本，因此直接传输模型参数并不能很好地保护数据隐私，仍需要一种机制对传输的模型参数进行保护。
[0004]...

【技术保护点】

【技术特征摘要】
1.基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法，其特征是，设有中央服务器和若干个客户端，对若干个客户端的本地模型进行N轮训练并进行添加噪声后上传至中央服务器，对中央服务器的全局模型进行迭代训练，对于单个客户端的本地模型的某一轮训练，具体包括以下步骤：步骤1，从中央服务器下载全局模型参数作为本地模型参数，本地模型参数为各个损失函数参数，对各个损失函数参数求导得到当前梯度；步骤2，裁剪限定每个当前梯度的敏感度，得到优化梯度值；步骤3，对本地模型进行随机采样得到预选集合，并对预选集合里梯度向量的值进行排序；步骤4，取预选集合里梯度向量前若干个值构成优化梯度向量，寻找预选集合中与优化梯度值余弦距离最近的梯度向量值；步骤5，利用预选集合中与优化梯度值余弦距离最近的梯度向量值对优化梯度值进行编码，计算得到采样率；步骤6，根据采样率对优化梯度值进行编码更新，并对更新后的优化梯度值添加噪声；步骤7，对本地模型参数进行更新；步骤8，通过瑞丽距离计算差分隐私预算；步骤9，通过本地测试数据集对本地模型进行测试得到更新后的本地模型添加噪声分布后的准确率，并计算不同噪声对应的优势值；步骤10，选取优势值最大的噪声分布作为本地模型此轮所添加的噪声，并上传添加该噪声下的本地模型参数至中央服务器。2.根据权利要求1所述的基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法，其特征是，所述的步骤3具体为，通过标准高斯分布中进行随机采样得到n个随机向量，得到预选集合，预选集合中第j个随机向量的维数为k，，对向量各维度的值进行从大到小的排序得到，得到新的集合。3.根据权利要求2所述的基于瑞丽散度进行噪声添加的联邦学习差分隐私保护方法，其特征是，所述...

【专利技术属性】
技术研发人员：周鹏，叶卫，王文，王政，江樱，戚伟强，郭亚琼，王以良，陈逍潇，张烨华，刘若琳，陆鑫，宋宇波，周升，邱一川，陈超，孙嘉赛，董科，钱经纬，徐子超，
申请(专利权)人：东南大学国网浙江省电力有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人