【技术实现步骤摘要】
隐私保护的在线深度学习系统及方法
[0001]本申请涉及数据安全和隐私保护
,尤其涉及隐私计算和联邦学习
,具体涉及一种隐私保护的在线深度学习系统及方法。
技术介绍
[0002]隐私保护计算(Privacy
‑
Preserving Computing)通常理解为在保护隐私信息安全前提下进行数据相关计算及分析和挖掘数据价值。与隐私保护计算比较接近的概念是隐私计算(Privacy Computing)。隐私计算的概念可以宽泛地理解为涵盖了在处理各种信息时对其中涉及的隐私信息进行各种操作从而在隐私信息的整个生命周期提供保护的计算理论和方法。隐私保护计算和隐私计算各自的概念的定义和范畴随着理论研究和应用技术发展而发生变化,并且相应的计算框架、计算模型、计算理论、算法及应用技术等也在迅速发展,但是都以隐私保护作为主要目的,例如保护各个参与方的隐私安全信息等。多种关键技术在隐私保护方面有重要应用,例如联邦学习(Federated Learning,FL)、安全多方计算(Multi
‑
Party Computation,MPC)等。
[0003]人工智能技术和深度学习技术取得了巨大的发展,如在智能交通、医疗健康、图像处理、自然语言处理等领域取得了广泛应用。在这些应用中也涉及到隐私保护,特别是随着相关法律法规加强了对用户个人隐私信息如用户交通出行数据和电商交易数据等的保护,使得在深度学习应用中越来越需要重视隐私保护方面。另一方面,随着交互频率增加和模型复杂度增加,深度学习应用例 ...
【技术保护点】
【技术特征摘要】
1.一种隐私保护的在线深度学习方法,其特征在于,所述在线深度学习方法包括:通过客户端,对该客户端所持有的训练数据进行同态加密HE安全协议下的加密处理并将加密后训练数据发送给服务器端;通过服务器端,利用自该客户端接收的加密后训练数据对深度学习模型进行训练,并且在训练该深度学习模型的训练过程中,对该深度学习模型所包括的至少一个线性层的线性成分和偏置成分分别进行差分隐私DP安全协议下的加密处理和该HE安全协议下的加密处理,从而得到该深度学习模型的加密后梯度;和基于该加密后梯度获得该深度学习模型的加密后模型参数,以及利用该加密后模型参数来更新该深度学习模型。2.根据权利要求1所述的在线深度学习方法,其特征在于,该加密后梯度包括该加密后梯度的线性成分和该加密后梯度的偏置成分,其中,基于该加密后梯度获得该深度学习模型的加密后模型参数,包括:通过该服务器端对该加密后梯度的偏置成分进行整合得到该加密后模型参数的偏置成分,以及通过该客户端对该加密后梯度的线性成分进行解密及加噪处理得到该加密后模型参数的线性成分。3.根据权利要求2所述的在线深度学习方法,其特征在于,利用该加密后模型参数来更新该深度学习模型,包括:通过该服务器端,利用该加密后模型参数的线性成分和该加密后模型参数的偏置成分,更新该深度学习模型。4.根据权利要求3所述的在线深度学习方法,其特征在于,该深度学习模型包括多个线性层,其中对该深度学习模型所包括的至少一个线性层的线性成分和偏置成分分别进行该DP安全协议下的加密处理和该HE安全协议下的加密处理,包括:对该多个线性层的每一个线性层各自的线性成分和偏置成分分别进行该DP安全协议下的加密处理和该HE安全协议下的加密处理。5.根据权利要求4所述的在线深度学习方法,其特征在于,所述多个线性层包括卷积层和/或全连接层,该深度学习模型还包括至少一个非线性层,该至少一个非线性层包括池化层和/或激活层。6.根据权利要求4所述的在线深度学习方法,其特征在于,所述多个线性层的每一个线性层指示了线性转换,所述多个线性层所指示的线性转换包括卷积运算和/或全连接运算,该深度学习模型还包括至少一个非线性层,该至少一个非线性层指示了非线性转换,该至少一个非线性层所指示的非线性转换包括池化运算和/或激活函数。7.根据权利要求5所述的在线深度学习方法,其特征在于,该客户端所持有的训练数据包括用于更新已训练的该深度学习模型的训练数据。8.根据权利要求5所述的在线深度学习方法,其特征在于,该深度学习模型的推理过程包括:针对所述多个线性层的每一个线性层,通过数据应用方生成与该线性层对应的第一随机向量和通过该服务器端生成与该线性层对应的第二随机向量,该数据应用方和该服务器端一起基于该第一随机向量和该第二随机向量构建对应该线性层的秘密分享安全协议;通过该数据应用方,将输入数据加密后发送给该服务器端;和按照所述多个线性层在该深度学习的推理过程中的调用次序逐层调用所述多个线性层,并且根据对应被调用的线性层的秘密分享安全协议,通过与被调用的线性层对应的第一随机向量加密被调用的线性层的输入以及通过与被调用的线性层对应的第二随机向量
加密被调用的线性层的输出。9.根据权利要求8所述的在线深度学习方法,其特征在于,该深度学习模型的应用场景包括以下至少之一:金融、政务、智能交通、医疗健康、图像处理、自然语言处理和隐私计算,该深度学习模型的推理过程用于完成该深度学习模型的应用场景下的一个或者多个任务。10.根据权利要求8所述的在线深度学习方法,其特征在于,根据对应被调用的线性层的秘密分享安全协议,通过与被调用的线性层对应的第一随机向量加密被调用的线性层的输入以及通过与被调用的线性层对应的第二随机向量加密被调用的线性层的输出,包括:将与被调用的线性层对应的第一随机向量和被调用的线性层的输入进行相加运算或者相减运算从而加密被调用的线性层的输入,通过被调用的线性层的线性成分对加密后的被调用的线性层的输入进行线性转换后加上与被调用的线性层对应的第二随机向量,从而加密被调用的线性层的输出。11.根据权利要求10所述的在线深度学习方法,其特征在于,该数据应用方与该客户端不属于同一平台、不属于同一系统、不在同一地理位置或者不属于同一网络。12.根据权利要求8所述的在线深度学习方法,其特征在于,该数据应用方包括多个输入数据,该深度学习模型的推理过程包括针对该多个输入数据的每一个输入数据,构建所述多个线性层中的每一个线性层的针对该输入数据的对应该线性层的秘密分享安全协议。...
【专利技术属性】
技术研发人员:李晋杰,
申请(专利权)人:深圳致星科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。