一种基于EMD距离融合多源异构数据的联邦学习方法技术

技术编号：29331854 阅读：71 留言：0更新日期：2021-07-20 17:49

本发明专利技术公开了一种基于EMD距离融合多源异构数据的联邦学习方法，其中，联邦模型进行训练包括：各参与方对己方本地数据X

全部详细技术资料下载

【技术实现步骤摘要】
一种基于EMD距离融合多源异构数据的联邦学习方法
本专利技术涉及计算机科学与技术中人工智能
，具体涉及一种基于EMD距离融合多源异构数据的联邦学习方法。
技术介绍
数据是人工智能的三个要素之一。然而，由于商业竞争、法律法规限制、数据来源和形式不同等因素，互联网中海量的数据往往都以数据孤岛的形式存在。联邦学习(FederatedLearning)是一种加密的分布式机器学习，是能够打通数据壁垒、保护数据隐私的新兴技术。谷歌公司在论文“Communication-EfficientLearningofDeepNetworksfromDecentralizedData”(McmahanHB,MooreE,RamageD,etal.Communication-EfficientLearningofDeepNetworksfromDecentralizedData[A/OL].arXiv.org,2016)首次提出了联邦学习的概念，并联合了成百上千的安卓手机，对其手机输入法GBoard进行优化，大大提升了用户体验。联邦学习可以联合多个数据源的数据，减少决策中的片面性和不确定性，从而得到比仅仅使用单一来源的数据更加全面、更加客观、更加准确的决策。联邦学习是一种分布式的机器学习，使得数据可以在不出本地的前提下协同进行机器学习模型的训练和迭代，克服了数据流通不便的障碍，把不同来源的数据联合利用的同时能够保护数据隐私。因此，联邦学习是发挥大数据价值的一个新思路。多源数据融合的概念起源于上世纪七十年代军事系统的多传感器数据融...

【技术保护点】
1.一种基于EMD距离融合多源异构数据的联邦学习方法，其特征在于，包括：基于EMD距离融合多源异构数据对联邦模型进行训练，联邦系统各参与方把训练好的联邦模型部署到自己的计算机系统中，用于具体的业务处理中；其中，基于EMD距离融合多源异构数据对联邦模型进行训练包括：/nS1，联邦学习系统的各参与方按照预设规则对己方本地数据X

【技术特征摘要】
1.一种基于EMD距离融合多源异构数据的联邦学习方法，其特征在于，包括：基于EMD距离融合多源异构数据对联邦模型进行训练，联邦系统各参与方把训练好的联邦模型部署到自己的计算机系统中，用于具体的业务处理中；其中，基于EMD距离融合多源异构数据对联邦模型进行训练包括：
S1，联邦学习系统的各参与方按照预设规则对己方本地数据Xi进行数据预处理并分块；
S2，确定中心服务器，中心服务器选取要训练的联邦模型并初始化模型参数，将联邦模型及其参数发送至各参与方；
S3，参与方利用接收到的模型及其参数，结合本地数据对模型进行训练，得到优化后的联邦整体模型；
S4，各参与方计算各方数据块Xik相对于整体模型的EMD距离，并上传回中心服务器，中心服务器对各方数据块的EMD距离从小到大排序，去掉EMD距离超过K的数据块，发送剩下的数据块编号给对应的参与方，并进入下一轮联邦迭代；K>0；
S5，对进入下一轮迭代的参与方的数据进行随机打乱顺序、重新划分数据块，重复执行步骤S3-S4，...

【专利技术属性】
技术研发人员：顾钊铨，李鉴明，仇晶，田志宏，方滨兴，丛悦，韩伟红，王乐，唐可可，李树栋，李默涵，
申请(专利权)人：广州大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人