【技术实现步骤摘要】
基于横向联邦学习的Fisher线性判别器建模方法
[0001]本专利技术涉及机器学习
,具体涉及一种基于横向联邦学习的Fisher线性判别器建模方法。
技术介绍
[0002]分类任务是机器学习领域一种重要的有监督学习任务。它通过在带有已知标签的样本数据集上进行训练,得到一个分类模型,该样本集成为训练集;利用该模型应用在未知标签的数据样本,预测该样本的标签。通常一个样本可以用一个d维向量x
i
∈R
d
来表示,其中R表示实数集,一个有n个样本的集合表示为x=(x1,x2,...,x
n
)。在训练集上每个样本带有一个用整数标签y
i
,用来指示该样本属于那个类别。在二分类任务中,y
i
有0,1两种可能的标签。某一主体,企业或个人,在应用Fisher判别器进行训练建模时,首先需要收集用于训练的数据。经常这些数据来源于不同的数据拥有者手中。这些数据有可能是敏感的数据。出于隐私方面的考虑,这些数据拥有者可能不愿意或者法律不允许对外提供这些敏感数据。在这种情况下,训练模型的主体可能收集不到足够用来训练的数据,从而影响了模型的准确度,甚至无法完整模型的训练。为此,有必要研究能够兼顾数据隐私的Fisher线性判别器建模方法。
[0003]如中国专利CN113469262A,公开日2021年10月1日,一种基于Fisher信息矩阵的增量学习方法。该方法通过计算Fisher信息矩阵判定神经网络各层参数的重要性;通过分离层间参数和层内参数, ...
【技术保护点】
【技术特征摘要】
1.基于横向联邦学习的Fisher线性判别器建模方法,其特征在于,包括:参与方Pk选定协调方,参与方Pk分别计算本地数据两个类别样本和参与方Pk选定协调方,参与方Pk分别计算本地数据两个类别样本和其中W
k,0
为第一类样本的和,W
k,1
为第二类样本的和,x
k,i
为样本数据的特征值向量,y
k,i
为样本数据的标签值;全部参与方Pk生成随机数向量R
k,0
和R
k,1
,满足以及参与方Pk计算向量T
k,0
=W
k,0
+R
k,0
和向量T
k,1
=W
k,1
+R
k,1
,把T
k,0
、T
k,1
、N
k,0
及N
k,1
发送给协调方,N
k,0
及N
k,1
分别为本地数量标签值为0及1的样本数据的数量;协调方计算两类样本数据的特征值向量的平均值向量m0和m1,并发送给各个参与方Pk;参与方Pk各自计算参与方Pk各自计算而后计算U
k
=U
k,0
+U
k,1
;全部参与方P
k
生成随机数向量R
k,0
和R
k,1
,满足以及参与方P
k
各自计算V
k
=U
k
+R
k
,把V
k
发送给协调方;协调方计算令S
B
=(m0‑
m1)*(m0‑
m1)
T
,协调方计算方程(S
B
‑
γS
in
)w=0的特征根w,将特征根w发送给各个参与方P
k
,参与方P
k
根据特征根w建立Fisher线性判别器模型。2.根据权利要求1所述的基于横向联邦学习的Fisher线性判别器建模方法,其特征在于,全部参与方Pk生成随机数向量R
k,0
和R
k,1
的方法包括:赋予全部参与方Pk排序,参与方之间两两配对;配对的参与方Pk和参与方Pi交换相同的秘钥,记为C
k,j
,根据C
k,j
生成随机数;参与方Pk和参与方Pi约定随机...
【专利技术属性】
技术研发人员:阮安邦,袁凯,林振民,
申请(专利权)人:北京八分量信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。