一种基于区块链的联邦学习可信训练方法及装置制造方法及图纸

技术编号：35441850 阅读：18 留言：0更新日期：2022-11-03 11:52

本发明专利技术涉及一种基于区块链的联邦学习可信训练方法。该方法包括以下步骤：协调方发起联邦学习训练任务请求；参与方将自身数据集的统计信息加密上链；监管方获取各参与方数据集每项特征的统计信息并校验各参与方数据集统计信息的分布总偏离度；参与方进行本地训练，训练所得梯度信息加密上链；监管方校验参与方的梯度信息；协调方对参与方的梯度信息进行安全聚合；协调方将聚合后的梯度信息发送给各参与方以更新本地模型；参与方判断模型是否收敛或者迭代次数是否到上限。本发明专利技术避免了由于分布不一致导致的训练失败的情况，可以通过梯度信息异常识别出恶意参与方，保障联邦学习任务正常运行，也提高了监管方在联邦学习的参与度和了解程度。和了解程度。和了解程度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于区块链的联邦学习可信训练方法及装置

[0001]本专利技术涉及区块链及联邦学习技术，尤其涉及一种基于区块链的联邦学习可信训练方法及装置。

技术介绍

[0002]传统的联邦学习方法是通过多个参与方与一个协调方共同训练一个模型达到数据隐私共享的效果。在训练前各方协商好训练模型和数据格式，由协调方分发初始模型参数，然后参与方各自在本地使用自己的数据集进行训练，训练后，各个参与方将加密后的梯度参数发给协调方，协调方汇总各个参与方的梯度参数之后进行安全梯度聚合，再分发给各个参与方继续训练，该过程迭代若干次后直至满足预设迭代次数或模型收敛为止。
[0003]联邦学习旨在建立一个基于分布数据集的联邦学习模型。在模型训练的过程中，模型相关的信息能够在各方之间交换(或者是以加密形式进行交换)，但各自的数据不能交换。这一交换不会暴露每个节点上任何受保护的隐私数据。传统联邦学习方法着重针对好奇敌手模型(敌手诚实地遵守协议，但也会试图从接收到的信息中学习更多除输出以外的信息)来保护各方数据隐私，但也存在以下几方面的缺点：
[0004](1)比较难预防恶意敌手的攻击，恶意敌手通过提供坏数据来腐败整个训练模型，让联邦学习任务失败。因为联邦学习过程设计多方共同协作，出于隐私保护各方也没办法看到其他成员的数据，所以当训练任务出现恶意敌手时，也很难识别出来。比如在多方数据参与计算过程中，有些节点是恶意节点(就是想参与计算，获取对方的原始数据)，意在通过用非法数据或模型来套取数据。如果某个参与方，最开始与对方协商是用固定的一批数...

【技术保护点】

【技术特征摘要】
1.一种基于区块链的联邦学习可信训练方法，其特征在于，包括以下步骤：步骤S1，协调方发起联邦学习训练任务请求；步骤S2，参与方将自身数据集的统计信息加密上链；步骤S3，监管方获取各参与方数据集每项特征的统计信息并校验各参与方数据集统计信息的分布总偏离度；步骤S4，参与方进行本地训练，训练所得梯度信息加密上链；步骤S5，监管方校验参与方的梯度信息；步骤S6，协调方对参与方的梯度信息进行安全聚合；步骤S7，协调方将聚合后的梯度信息发送给各参与方以更新本地模型；步骤S8，参与方判断模型是否收敛或者迭代次数是否到上限，若否，返回步骤S4迭代，若是，则结束训练。2.如权利要求1所述的方法，其特征在于，所述步骤S2中，数据集的统计信息至少包括均值、中位数、标准差、WOE值、IV值。3.如权利要求1所述的方法，其特征在于，所述步骤S3中，监管方获取各参与方数据集统计信息之后，监管方两两比较参与方数据集同一项特征的偏离度是否超过设定值，遍历所有参与方的所有特征，最后汇总得到分布总偏离度，若分布总偏离度低于阈值，则校验通过并进入下一步，否则终止训练任务。4.如权利要求3所述的方法，其特征在于，所述步骤S3中，监管方两两比较参与方数据集同一项特征的偏离度时，依据参与方数据集一项特征的分布规律及统计信息生成随机数集，然后判断随机数集落在另一参与方数据集对应项特征的分布范围之外的比例，若比例超过设定值，则记偏离度为1，否则记偏离度为0；遍历所有参与方的所有特征之后，最后把偏离度加起来得到分布总偏离度。5.如权利要求1所述的方法，其特征在于，所述步骤S4包括：步骤S41，参与方将任务编码和参数信息摘要上传到区块链中；步骤S42，参与方查询该任务编码的其他参与方的参数信息摘要是否与自身一致，若一致，则进行下一步，否则终止训练任务；步骤S43，初始化模型训练环境，拉取本地数据集，开始执行训练任务，训练所得梯度信息加密上链。6.如权利要求1所述的方法，其特征在于，所述步骤S5包括：步骤S51，用随机数初始化一个数据集作为虚拟数据集，虚拟数据集的记录数为训练批次大小，虚拟数据集每条记录的特征数量与参与方数据集数据记...

【专利技术属性】
技术研发人员：王济平，黎刚，汤克云，周健雄，谢晓锋，
申请(专利权)人：京信数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人