基于联合学习的数据分析方法、装置、设备及存储介质制造方法及图纸

技术编号:38126581 阅读:23 留言:0更新日期:2023-07-08 09:31
本公开涉及联合学习技术领域,尤其涉及一种基于联合学习的数据分析方法、装置、设备及存储介质,该方法包括:接收多个资源方发送的申报资源元数据,申报资源元数据中至少携带有单位资源指标、贡献申报值;根据单位资源指标,在多个资源方中选择资源提供方,以使资源提供方参与联合学习,共同训练联合学习模型;确定资源提供方对于训练联合学习模型的实际贡献值;若根据贡献申报值以及实际贡献值,确定资源提供方存在失真数据,则根据失真数据,确定资源提供方申报资源元数据为不合格。资源提供方申报资源元数据为不合格。资源提供方申报资源元数据为不合格。

【技术实现步骤摘要】
基于联合学习的数据分析方法、装置、设备及存储介质


[0001]本公开涉及联合学习
,尤其涉及一种基于联合学习的数据分析方法、装置、设备及存储介质。

技术介绍

[0002]联合学习是一种机器学习设定,其中许多客户端在中央服务器的协调下共同训练模型,同时保持训练数据的去中心化及分散性。联合学习的长期目标:在不暴露数据的情况下分析和学习多个数据拥有者的数据。
[0003]在联合学习中,需要确保参与方得到的支付能覆盖其提供资源的成本,否则参与方将不会长期持续参与联合学习。一般而言,联合学习平台作为中央服务器,会允许参与方申报自己的资源成本,并从中选择参与方训练模型。这使得恶意参与方可能通过虚报资源数量、质量和成本,将其他参与方排除在训练之外,从而不正当获利。虚报资源数量和质量也造成参与方训练的模型效果达不到预期,给平台带来损失。
[0004]因此,需要一种能够基于联合学习进行数据分析的方案,来打击这种恶意行为。

技术实现思路

[0005]有鉴于此,本公开实施例提供了一种联合学习失真数据的数据分析方法、装置、电子设备及计算机可读存储介质,以解决现有技术中需要一种能够基于联合学习进行数据分析的方案,来打击这种恶意行为的问题。
[0006]本公开实施例的第一方面,提供了一种基于联合学习的数据分析方法,包括:
[0007]接收多个资源方发送的申报资源元数据,申报资源元数据中至少携带有单位资源指标、贡献申报值;
[0008]根据单位资源指标,在多个资源方中选择资源提供方,以使资源提供方参与联合学习,共同训练联合学习模型;
[0009]确定资源提供方对于训练联合学习模型的实际贡献值;
[0010]若根据贡献申报值以及实际贡献值,确定资源提供方存在失真数据,则根据失真数据,确定所述资源提供方申报资源元数据为不合格。
[0011]本公开实施例的第二方面,提供了一种基于联合学习的数据分析装置,包括:
[0012]数据接收模块,接收多个资源方发送的申报资源元数据,申报资源元数据中至少携带有单位资源指标、贡献申报值;
[0013]联合学习模块,根据单位资源指标,在多个资源方中选择资源提供方,以使资源提供方参与联合学习,共同训练联合学习模型;
[0014]贡献值确定模块,确定资源提供方对于训练联合学习模型的实际贡献值;
[0015]数据判定模块,若根据贡献申报值以及实际贡献值,确定资源提供方存在失真数据,则根据失真数据,确定所述资源提供方申报资源元数据为不合格。
[0016]本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在
存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
[0017]本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
[0018]本公开实施例与现有技术相比存在的有益效果是:通过对实际贡献值以及贡献申报值之间的差异,能够准确地判断资源提供方是否存在失真数据。若其存在失真数据,则可以对其进行风险排除,使其对自身的失真数据埋单,通过风险排除来降低资源提供方失真数据的减少,保证联合学习模型的训练成果。
附图说明
[0019]为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0020]图1是本公开实施例的一种联合学习的架构示意图;
[0021]图2是本公开实施例提供的一种基于联合学习的数据分析方法的流程示意图;
[0022]图3是本公开实施例提供的一种基于联合学习的数据分析装置的结构示意图;
[0023]图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
[0024]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
[0025]联合学习是指在确保数据安全及用户隐私的前提下,综合利用多种AI(Artificial Intelligence,人工智能)技术,联合多方合作共同挖掘数据价值,催生基于联合建模的新的智能业态和模式。联合学习至少具有以下特点:
[0026](1)参与节点控制自有数据的弱中心化联合训练模式,确保共创智能过程中的数据隐私安全。
[0027](2)在不同应用场景下,利用筛选和/或组合AI算法、隐私保护计算,建立多种模型聚合优化策略,以获取高层次、高质量的模型。
[0028](3)在确保数据安全及用户隐私的前提下,基于多种模型聚合优化策略,获取提升联合学习引擎的效能方法,其中效能方法可以是通过解决包括计算架构并行、大规模跨域网络下的信息交互、智能感知、异常处理机制等,提升联合学习引擎的整体效能。
[0029](4)获取各场景下多方用户的需求,通过互信机制,确定合理评估各联合参与方的真实贡献度,进行分配激励。
[0030]基于上述方式,可以建立基于联合学习的AI技术生态,充分发挥行业数据价值,推动垂直领域的场景落地。
[0031]下面将结合附图详细说明根据本公开实施例的一种基于联合学习的数据分析方
法和装置。
[0032]图1是本公开实施例的一种联合学习的架构示意图。如图1所示,联合学习的架构可以包括服务器(中心节点)101以及参与方102、参与方103和参与方104。
[0033]在联合学习过程中,基本模型可以通过服务器101建立,服务器101将该模型发送至与其建立通信连接的参与方102、参与方103和参与方104。基本模型还可以是任一参与方建立后上传至服务器101,服务器101将该模型发送至与其建立通信连接的其他参与方。参与方102、参与方103和参与方104根据下载的基本结构和模型参数构建模型,利用本地数据进行模型训练,获得更新的模型参数,并将更新的模型参数加密上传至服务器101。服务器101对参与方102、参与方103和参与方104发送的模型参数进行聚合,获得全局模型参数,并将全局模型参数传回至参与方102、参与方103和参与方104。参与方102、参与方103和参与方104根据接收的全局模型参数对各自的模型进行迭代,直到模型最终收敛,从而实现对模型的训练。在联合学习过程中,参与方102、参与方103和参与方104上传的数据为模型参数,本地数据并不会上传至服务器101,且所有参与方可以共享最终的模型参数,因此可以在保证数据隐私的基础上实现共同建模。需要说明的是,参与方的数量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联合学习的数据分析方法,其特征在于,包括:接收多个资源方发送的申报资源元数据,所述申报资源元数据中至少携带有单位资源指标、贡献申报值;根据所述单位资源指标,在所述多个资源方中选择资源提供方,以使所述资源提供方参与联合学习,共同训练联合学习模型;确定所述资源提供方对于训练所述联合学习模型的实际贡献值;若根据所述贡献申报值以及所述实际贡献值,确定所述资源提供方存在失真数据,则根据所述失真数据,确定所述资源提供方申报资源元数据为不合格。2.根据权利要求1所述的方法,其特征在于,所述根据所述贡献申报值以及所述实际贡献值,确定所述资源提供方存在失真数据,具体包括:根据所述贡献申报值、所述实际贡献值中分别携带的申报数据数量之间的差异,或,所述贡献申报值中携带的申报数据质量和所述实际贡献值中携带的平均申报数据质量的差异,得到对应的偏差系数;根据所述偏差系数,确定所述资源提供方存在失真数据;所述根据所述失真数据,确定所述资源提供方申报资源元数据为不合格之后,所述方法还包括:对所述偏差系数进行修正,得到所述失真数据的风险系数;根据所述风险系数,以及所述联合学习模型的总数据值,得到所述资源提供方的风险项数据;根据所述风险项数据,对所述资源提供方进行风险排除。3.根据权利要求2所述的方法,其特征在于,所述对所述偏差系数进行修正,得到对应的风险系数,具体包括:确定预先设置的偏差风险指数;根据所述偏差风险指数,以乘积的方式对所述偏差系数进行修正,得到风险系数。4.根据权利要求3所述的方法,其特征在于,所述根据所述失真数据,对所述资源提供方进行风险排除,具体包括:根据公式Payment
i
=(C
i

d*lmbs)*B,对所述资源提供方i的资源输入项进行风险排除,其中,Payment
i
为所述资源提供方i的实际资源输入项,C
i
为所述资源提供方i的所述实际贡献值,d为所述偏差系数,lmbs为所述偏差风险指数,B为所述联合学习模型的总数据值。5.根据权利要求3所...

【专利技术属性】
技术研发人员:刘嘉李增祥
申请(专利权)人:新智我来网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1