基于联合学习的数据分析方法、装置、设备及存储介质制造方法及图纸

技术编号：38126581 阅读：36 留言：0更新日期：2023-07-08 09:31

本公开涉及联合学习技术领域，尤其涉及一种基于联合学习的数据分析方法、装置、设备及存储介质，该方法包括：接收多个资源方发送的申报资源元数据，申报资源元数据中至少携带有单位资源指标、贡献申报值；根据单位资源指标，在多个资源方中选择资源提供方，以使资源提供方参与联合学习，共同训练联合学习模型；确定资源提供方对于训练联合学习模型的实际贡献值；若根据贡献申报值以及实际贡献值，确定资源提供方存在失真数据，则根据失真数据，确定资源提供方申报资源元数据为不合格。资源提供方申报资源元数据为不合格。资源提供方申报资源元数据为不合格。

全部详细技术资料下载

【技术实现步骤摘要】
基于联合学习的数据分析方法、装置、设备及存储介质

[0001]本公开涉及联合学习
，尤其涉及一种基于联合学习的数据分析方法、装置、设备及存储介质。

技术介绍

[0002]联合学习是一种机器学习设定，其中许多客户端在中央服务器的协调下共同训练模型，同时保持训练数据的去中心化及分散性。联合学习的长期目标：在不暴露数据的情况下分析和学习多个数据拥有者的数据。
[0003]在联合学习中，需要确保参与方得到的支付能覆盖其提供资源的成本，否则参与方将不会长期持续参与联合学习。一般而言，联合学习平台作为中央服务器，会允许参与方申报自己的资源成本，并从中选择参与方训练模型。这使得恶意参与方可能通过虚报资源数量、质量和成本，将其他参与方排除在训练之外，从而不正当获利。虚报资源数量和质量也造成参与方训练的模型效果达不到预期，给平台带来损失。
[0004]因此，需要一种能够基于联合学习进行数据分析的方案，来打击这种恶意行为。

技术实现思路

[0005]有鉴于此，本公开实施例提供了一种联合学习失真数据的数据分析方法、装置、电子设备及计算机可读存储介质，以解决现有技术中需要一种能够基于联合学习进行数据分析的方案，来打击这种恶意行为的问题。
[0006]本公开实施例的第一方面，提供了一种基于联合学习的数据分析方法，包括：
[0007]接收多个资源方发送的申报资源元数据，申报资源元数据中至少携带有单位资源指标、贡献申报值；
[0008]根据单位资源指标，在多个资源方中选择资源提供方，以...

【技术保护点】

【技术特征摘要】
1.一种基于联合学习的数据分析方法，其特征在于，包括：接收多个资源方发送的申报资源元数据，所述申报资源元数据中至少携带有单位资源指标、贡献申报值；根据所述单位资源指标，在所述多个资源方中选择资源提供方，以使所述资源提供方参与联合学习，共同训练联合学习模型；确定所述资源提供方对于训练所述联合学习模型的实际贡献值；若根据所述贡献申报值以及所述实际贡献值，确定所述资源提供方存在失真数据，则根据所述失真数据，确定所述资源提供方申报资源元数据为不合格。2.根据权利要求1所述的方法，其特征在于，所述根据所述贡献申报值以及所述实际贡献值，确定所述资源提供方存在失真数据，具体包括：根据所述贡献申报值、所述实际贡献值中分别携带的申报数据数量之间的差异，或，所述贡献申报值中携带的申报数据质量和所述实际贡献值中携带的平均申报数据质量的差异，得到对应的偏差系数；根据所述偏差系数，确定所述资源提供方存在失真数据；所述根据所述失真数据，确定所述资源提供方申报资源元数据为不合格之后，所述方法还包括：对所述偏差系数进行修正，得到所述失真数据的风险系数；根据所述风险系数，以及所述联合学习模型的总数据值，得到所述资源提供方的风险项数据；根据所述风险项数据，对所述资源提供方进行风险排除。3.根据权利要求2所述的方法，其特征在于，所述对所述偏差系数进行修正，得到对应的风险系数，具体包括：确定预先设置的偏差风险指数；根据所述偏差风险指数，以乘积的方式对所述偏差系数进行修正，得到风险系数。4.根据权利要求3所述的方法，其特征在于，所述根据所述失真数据，对所述资源提供方进行风险排除，具体包括：根据公式Payment
i
＝(C
i
‑
d*lmbs)*B，对所述资源提供方i的资源输入项进行风险排除，其中，Payment
i
为所述资源提供方i的实际资源输入项，C
i
为所述资源提供方i的所述实际贡献值，d为所述偏差系数，lmbs为所述偏差风险指数，B为所述联合学习模型的总数据值。5.根据权利要求3所...

【专利技术属性】
技术研发人员：刘嘉，李增祥，
申请(专利权)人：新智我来网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人