一种基于拆分学习的隐私保护联合训练平台制造技术

技术编号：44935023 阅读：4 留言：0更新日期：2025-04-12 01:13

本发明专利技术涉及一种基于拆分学习的隐私保护联合训练平台，旨在实现多方协作下的高效模型训练，同时保护参与方的数据隐私，特别是在皮肤健康检测领域。该平台通过拆分学习技术，将模型分为两部分，前半部分在参与方本地训练，后半部分在中央服务器训练，参与方仅需共享中间激活值或梯度参数，确保了患者医疗数据安全。为进一步增强数据隐私保护，本发明专利技术引入差分隐私技术，通过向梯度添加随机噪声，防止数据泄露，并确保合规性。该平台灵活且可扩展，适用于医疗、金融、物联网等多个领域，降低数据传输成本、缩短模型开发周期，使参与方在保护数据隐私的前提下实现高效协作与创新，推动拆分学习技术在皮肤健康检测领域的发展与应用。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术主要涉及人工智能以及图像检测领域，特别是基于拆分学习和差分隐私技术的图像检测方法。

技术介绍

1、随着数据隐私保护需求的增加，传统的集中式学习方法面临着数据泄露和隐私侵犯的风险。拆分学习作为一种新兴的分布式学习方法，允许参与方在不共享原始数据的情况下共同训练模型，从而有效保护数据隐私。通过将数据分散在不同的设备或地点，拆分学习可以在各自的本地进行模型训练，仅共享模型参数或梯度信息，从而避免直接接触敏感数据。

2、与此同时，差分隐私技术为数据的保护提供了理论基础。差分隐私通过在模型训练过程中添加随机噪声，确保任何单个数据点对模型输出的影响是有限的，从而保护用户的隐私。然而，差分隐私的实现往往会导致模型性能的下降，尤其是在数据量有限的情况下。

3、结合拆分学习和差分隐私技术的研究逐渐受到关注，旨在在确保数据隐私的同时，提升模型的学习效果和预测准确性。这一领域的研究和应用有助于在多个行业中安全地利用大数据，尤其是在医疗、金融等对隐私保护要求较高的领域。

技术实现思路

1、本专利技术提供了一种基于拆分学习的隐私保护联合训练平台，旨在解决多方协作中的数据隐私保护问题，特别是在皮肤健康检测领域。通过将模型分为两部分，前半部分在参与方本地训练，后半部分在中央服务器聚合，参与方仅需共享模型参数或中间激活值，避免了原始数据的传输，从而有效保护用户隐私。此外，平台引入差分隐私技术，通过向梯度添加随机噪声，限制单个数据点对模型输出的影响，确保数据使用的合规性。该平台灵活

2、本专利技术的目的可以通过以下技术方案来实现：

3、步骤s1：数据预处理，具体包括数据采集、标准化和数据划分；

4、步骤s2：模型训练，在多个设备上使用拆分学习方法对模型进行训练，所述方法包括模型初始化、参数更新和差分隐私添加，在模型训练过程中使用差分隐私技术向模型参数更新中添加噪声，以确保用户数据隐私；

5、步骤s3：模型验证，通过各种性能评估方法，评估模型的准确性和鲁棒性，确保其在未见数据上的表现；

6、步骤s4：皮肤健康预测，将训练好的模型应用于新的皮肤图像，输出皮肤健康检测结果。

7、进一步的，步骤s1包括：

8、步骤s1.1：数据采集，从公开数据集ham10000获取皮肤图像数据，所述数据集包含多种类型的皮肤病变图像；

9、步骤s1.2：数据标准化，将数据集中不同来源的图像进行标准化处理，具体包括：将图像缩放到统一的尺寸；将图像都转化为pytorch张量；最后按照

10、

11、进行标准化，其中outputc为标准化后的图像在通道c的像素值；inputc为原始图像在通道c的像素值；meanc为通道c的均值；stdc为通道c的标准差；

12、步骤s1.3：数据划分，将处理后的数据集划分为训练集dtrain和测试集dtest，具体包括：训练集用于模型的训练；测试集用于调参，模型选择以及最终性能评估，以确保模型的泛化能力。

13、进一步的，步骤s2包括：

14、步骤s2.1：模型初始化，在多个设备上初始化模型参数，具体包括选择合适的深度学习模型架构，例如模型的初始参数θ0；配置训练超参数，如学习率η、批量大小b和训练轮数e；

15、步骤s2.2：隐私保护下的拆分学习训练过程，具体包含客户端以及服务器端的训练过程以及噪声的添加；

16、步骤s2.3：监控训练过程，实时监控训练过程中的损失函数l(θ；dtrain)，l(θ；dtest)和准确率acc(θ；dtrain)，acc9θ；dtest)，以便判断模型的收敛情况，具体包括：记录每个训练轮次的损失值和准确率；根据监控结果，调整学习率η和其他超参数，以优化训练效果；

17、步骤s2.4：终止条件判断，在训练过程中根据预设的终止条件判断是否停止训练，具体包括：当验证集的性能在若干轮次内未能提升时，停止训练以防止过拟合；达到最大训练轮数e时，终止训练过程。

18、进一步的，步骤s2.2包括：

19、步骤s2.2.1：前向传播，在客户端进行前向传播，计算每层的激活值，直到达到客户端的最后一层；

20、步骤s2.2.2：发送激活信息，将客户端最后一层的输出激活信息发送给服务器端；

21、步骤s2.2.3：服务器端前向传播，服务器端继续进行前向传播并计算损失；

22、步骤s2.2.4：服务器端反向传播，服务器端进行反向传播，计算梯度然后将梯度信息发送回客户端；

23、步骤s2.2.5：服务器端噪声添加，在服务器端反向传播后，进行梯度裁剪后向梯度添加噪声，计算带噪声的梯度：

24、

25、

26、其中是经过裁剪后的梯度，为添加的随机噪声，此噪声符合均值为0，方差为σ2c2的高斯分布，其中σ是标准差，c是裁剪大小，i是梯度维度。为服务器端添加噪声后的平均梯度；

27、步骤s2.2.6：服务器端模型参数更新：

28、

29、其中表示当前的服务器端模型参数，表示更新后的服务器端模型参数；

30、步骤s2.2.7：客户端反向传播，客户端利用接收到的梯度信息进行反向传播，完成整个模型的训练；

31、步骤s2.2.8：客户端噪声添加，在客户端反向传播后，向模型参数更新中添加噪声，计算带噪声的梯度：

32、

33、

34、其中参数的含义与服务器端一致，只是参数为客户端所拥有；

35、步骤s2.2.9：客户端模型参数更新，使用添加噪声后的梯度更新客户端模型参数：

36、

37、其中参数的含义同样与服务器端一致。

38、进一步的，步骤s3包括：

39、步骤s3.1：交叉验证，将验证集dval划分为k个子集{dval,1,dval,2,…,dval,k}，进行k次训练和验证，具体包括：每次选择一个子集作为验证集其余k-1个子集作为训练集dtrain,k＝dval\dval,i，以评估模型的泛化能力；

40、步骤s3.2：性能评估，使用多种评估指标来评估模型在验证集上的性能，具体包括：

41、准确率(accuracy)：

42、

43、其中tp(true positives)是真正例，tn(true negatives)是真负例，fp(falsepositives)是假正例，fn(false negatives)是假负例。

44、召回率(recall)：

45、

46、精确率(precision)：

47、

48、

49、步骤s3.3：超参数调优，根据交叉验证的结果，调整模型的超参数(如学习率η本文档来自技高网...

【技术保护点】

1.一种基于拆分学习的隐私保护联合训练平台，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤S1中，数据预处理包含以下步骤：

3.根据权利要求1所述的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤S2中，模型训练包含以下步骤：

4.根据权利要求3所述的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤S2.2中，拆分学习训练包含以下步骤：

5.根据权利要求1所述的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤S3中，模型验证包含以下步骤：

6.根据权利要求1的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤S4中，皮肤健康预测包含以下步骤：

【技术特征摘要】

1.一种基于拆分学习的隐私保护联合训练平台，其特征在于，包括以下步骤：

2.根据权利要求1所述的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤s1中，数据预处理包含以下步骤：

3.根据权利要求1所述的一种基于拆分学习的隐私保护联合训练平台，其特征在于：步骤s2中，模型训练包含以下步骤：

4.根据权利要求...

【专利技术属性】
技术研发人员：张路，冯翔，
申请(专利权)人：华东理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人