基于联邦学习进行数据分析的方法及系统技术方案

技术编号：29095133 阅读：23 留言：0更新日期：2021-06-30 10:04

本发明专利技术提供了一种基于联邦学习进行数据分析的方法和系统，该方法采用了基于联邦学习建立的本地任务模型，其中，本地任务模型通过以下方法建立：基于训练样本数据构建面向指定特征的数据子图；利用数据子图训练本地任务模型；提取本地任务模型的模型参数上传至服务器以更新服务器模型参数，并利用更新后的服务器模型优化本地任务模型；重复上述步直至服务器模型收敛，基于收敛后的服务器模型优化本地任务模型。通过本发明专利技术的方法，能够在保护用户隐私的前提下，挖掘不同用户数据之间特异性特征与深度关联，利用图数据结构信息优化本地模型，实现对本地数据的精确分析和判断。实现对本地数据的精确分析和判断。实现对本地数据的精确分析和判断。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习进行数据分析的方法及系统

[0001]本专利技术涉及计算机数据挖掘领域，尤其涉及基于联邦学习进行数据分析的方法及系统。

技术介绍

[0002]在人工智能时代，机器学习依赖于大量的优质数据。然而受行业规范、数据安全标准和用户隐私担忧的约束，不同企业之间缺乏有效的信息互通与协作，彼此数据封闭孤立，以“信息孤岛”的形式存在。甚至即使是在同一个企业的不同部门之间，实现数据集中整合也面临着重重阻力。以医疗保健体系为例，各医疗机构拥有的用户数据相互隔离，单一医疗机构获得的用户数据量有限，难以训练得到优质的机器学习模型，因此无法采用传统集中式方法训练机器学习模型，导致大量数据无法被充分利用和准确分析。
[0003]联邦学习可以使得各参与方的自有数据不出本地，即在不违反数据隐私法规情况下，最大化发掘数据的价值，实现安全多方联合建模、多方共同获益。然而，现有的联邦学习在学习过程中数据隐私保护级别不高，建立的本地任务模型的性能非常有限。
[0004]因此，亟需一种更加安全、准确的进行数据分析的方法和系统。

技术实现思路

[0005]因此，本专利技术实施例的目的在于克服上述现有技术的缺陷，提供一种基于联邦学习训练服务器模型的方法，包括：获取多个本地任务模型的模型参数；通过同态加密和差分扰动的方法将所述多个本地任务模型的模型参数进行安全聚合；以及利用聚合后的模型参数更新当前的服务器模型。
[0006]本专利技术另一方面提供一种基于联邦学习建立本地任务模型的方法，包括：基于训练样本数据构建面...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习训练服务器模型的方法，包括：步骤1
‑
1)获取多个本地任务模型的模型参数；步骤1
‑
2)通过同态加密和差分扰动的方法将所述多个本地任务模型的模型参数进行安全聚合；以及步骤1
‑
3)利用聚合后的模型参数更新当前的服务器模型。2.一种基于联邦学习建立本地任务模型的方法，包括：步骤2
‑
1)基于训练样本数据构建面向指定特征的数据子图；步骤2
‑
2)利用所述数据子图训练本地任务模型；步骤2
‑
3)提取所述本地任务模型的模型参数上传至服务器以更新服务器模型参数，并通过权利要求1所述的方法获得更新后的服务器模型以优化所述本地任务模型；步骤2
‑
4)重复步骤2
‑
2)
‑
步骤2
‑
3)，直至所述服务器模型收敛，基于收敛后的所述服务器模型优化所述本地任务模型。3.根据权利要求2所述的方法，其中，所述基于所述训练样本数据构建面向指定特征的数据子图包括：依据所述指定特征，以所述训练样本数据中相关用户的用户属性信息作为结点，以所述相关用户之间的关联关系作为边，构建面向所述指定特征的数据子图。4.根据权利要求2所述的方法，其中，所述步骤2
‑
2)包括：基于所述数...

【专利技术属性】
技术研发人员：蒋鑫龙，陈前，陈益强，张腾，王永斌，张忠平，肖益珊，
申请(专利权)人：中国科学院计算技术研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人