当前位置: 首页 > 专利查询>之江实验室专利>正文

基于隐私保护下局部图信息交换的中心疾病预测方法和装置制造方法及图纸

技术编号:38441290 阅读:7 留言:0更新日期:2023-08-11 14:23
本发明专利技术公开了一种基于隐私保护下局部图信息交换的中心疾病预测方法,本发明专利技术通过构建图中间变量,并在差分隐私保护下完成各个医疗机构图中间变量的交换,从而保证了医疗机构在隐私保护场景下利用其他医疗机构的关系图信息完成本地图神经网络模型的训练,进而提升全局图神经网络模型的预测准确性。本发明专利技术还提供了基于隐私保护下局部图信息交换的中心疾病预测装置。预测装置。预测装置。

【技术实现步骤摘要】
基于隐私保护下局部图信息交换的中心疾病预测方法和装置


[0001]本专利技术属于联邦学习领域,具体涉及一种基于隐私保护下局部图信息交换的中心疾病预测方法和装置。

技术介绍

[0002]近年来,随着医疗信息技术的发展,许多医疗机构开始使用数据挖掘技术来改善疾病诊断的准确性。然而,一方面,单一医疗机构电子病历系统中积累的临床数据,由于样本量不足,数据质量较低的问题,其构建的机器学习模型往往质量不高。另一方面,在真实世界场景下,同一患者可能会到不同的医疗机构进行就诊,因此单家医疗机构的数据是不完整的,这也会导致使用这些数据训练的模型的预测准确性下降。
[0003]面对日益增长的数据需求,在隐私保护下联合多家医疗机构医疗数据构建高质量机器学习模型的联邦学习方法应运而生。
[0004]联邦学习主要目的是数据处理,但与一般机器学习有着明显的不同,其采用的是分布式学习,有利于解决某处数据严重不足,而使训练模型严重不好的问题,同时联邦学习对用户数据的隐私性比较重视,所以很快成为人们关注的重点,所以联邦学习是既具有研究价值同时又极具挑战性的热门课题。
[0005]不同于其他神经网络模型,将联邦学习应用于图神经网络模型时会遇见以下问题,在训练本地图神经网络模型时,由于其仅利用了本地的局部图信息而没有利用存于其他医疗机构的图信息,这往往会导致模型预测准确性下降。
[0006]联邦图神经网络采用分布式训练流程,各医疗机构参与方使用本地数据在本地训练局部图神经网络模型,然后将局部图神经网络模型的参数发送到中心机,中心机对局部图神经网络模型的参数进行联邦聚合,从而得到全局图神经网络模型。在这种情况下,由于每个医疗机构参与方在本地训练局部图神经网络模型时没有利用其他医疗机构参与方的局部图信息,局部图神经网络模型往往表现不佳,进而导致全局图神经网络模型的预测准确性下降。
[0007]此外,由于各个医疗机构参与方的局部图分布不一致,仅利用局部图构建的本地图神经网络模型也会存在较大的偏差,从而导致全局图神经网络模型的预测准确性下降。
[0008]因此,现有技术存在的问题为现有联邦图神经网络在训练过程中存在的问题,即在本地训练图模型时仅利用局部图数据,而未有效利用其他医疗机构参与方的关系图信息,导致本地图神经网络模型表现不佳的问题。

技术实现思路

[0009]本专利技术提供了一种基于隐私保护下局部图信息交换的中心疾病预测方法,利用该方法能够医疗机构在隐私保护场景下利用其他医疗机构的关系图信息完成本地图神经网络模型的训练,从而提高了完成训练后的全局图神经网络模型的预测能力。
[0010]本专利技术具体实施例提供了一种基于隐私保护下局部图信息交换的中心疾病预测
方法,包括:
[0011](1)对每个医疗机构的关系图的节点字符进行保密编码得到对应的节点编号,并构建由节点编号表示节点的关系图;
[0012](2)每个医疗机构具有本地图卷积神经网络,本地图卷积神经网络包括多层图卷积模块,图卷积模块用于基于当前医疗机构的关系图聚合当前医疗机构节点的邻居节点特征得到本地聚合结果,基于其他医疗机构的关系图通过节点编号对当前医疗机构节点的异地邻居节点特征进行加密聚合得到异地聚合结果,结合本地聚合结果和异地聚合结得到向量图卷积表示,将激活后的向量图卷积表示输入下一层图卷积模块,通过多层图卷积模块运算得到预测疾病类别,基于预测疾病类别和真实疾病类别计算损失函数,并采用梯度下降法训练本地图卷积神经网络;
[0013](3)多个医疗机构同步完成本地图卷积神经网络的训练,联邦聚合训练后得到的参数获得聚合参数,若聚合参数使得全局图卷积神经网络收敛,则将聚合参数发送至各本地图卷积神经网络得到疾病预测模型;
[0014](4)若不收敛则将聚合参数输入各本地图卷积神经网络重复步骤(2)

(3),直至得到的聚合参数使得全局图卷积神经网络收敛;
[0015](5)将患者的节点编号向量输入疾病预测模型得到预测疾病类别。
[0016]进一步的,基于其他医疗机构的关系图通过节点编号对当前医疗机构节点的异地邻居节点特征进行加密聚合得到异地聚合结果,包括:
[0017]基于其他医疗机构对应的关系图的节点度数矩阵和单位矩阵,其他医疗机构中与当前医疗机构对应层的图卷积模块的线性变换层参数,以及连接关系矩阵,同时引入差分隐私以获得局部图中间结果;
[0018]基于其他医疗机构的关系图的节点编号得到当前医疗机构和其他医疗机构对应关系图的节点间的连接关系矩阵;
[0019]基于当前医疗机构对应的节点的嵌入向量表示、当前医疗机构对应的关系图的节点度数矩阵和单位矩阵和多个其他医疗机构对应的多个局部中间结果获得异地聚合结果。
[0020]进一步的,在第t层图卷积模块,当前医疗机构j相对于其他医疗机构i的局部图中间结果为:
[0021][0022]其中,A
ij
为当前医疗机构i与其他医疗机构j的节点的连接关系矩阵,D
j
为其他医疗机构j对应的关系图的节点度数矩阵,I为单位矩阵,Laplace(0,λ)为零均值的拉普拉斯噪声,λ为拉普拉斯噪声的强度,为其他医疗机构j的第l层图卷积模块的线性变换层r的线性变换层参数。
[0023]进一步的,在第l层图卷积模块,当前医疗机构i异地聚合结果为:
[0024][0025]其中,D
i
为当前医疗机构i对应的关系图的节点度数矩阵,U
i
为当前医疗机构i的节
点编号的嵌入向量表示。
[0026]进一步的,基于其他医疗机构的关系图得到当前医疗机构和其他医疗机构对应的节点编号的连接关系矩阵,包括:
[0027]基于其他医疗机构的关系图的节点编号,获得当前医疗机构的节点与其他医疗机构的节点的连接关系,即当前医疗机构的节点与其他医疗机构的节点存在连边则在连接关系矩阵中对应位置的值标记为1,不存在连边则在连接关系矩阵中对应位置的值标记为0,从而构建连接关系矩阵。
[0028]进一步的,基于当前医疗机构的关系图聚合当前医疗机构节点的邻居节点特征得到本地聚合结果,包括:
[0029]基于当前医疗机构的关系图的节点度数矩阵和单元矩阵对邻接关系矩阵进行归一化,将归一化结果与线性向量表示相乘得到本地聚合结果;
[0030]所述线性向量表示通过将当前医疗机构的节点编号进行嵌入向量表示后进行线性变换得到或者将前一个图卷积模块的输出经过线性变换得到;
[0031]基于当前医疗机构的关系图得到当前医疗机构的节点间的邻接关系矩阵。
[0032]进一步的,对每个医疗机构的节点集合进行保密编码得到对应的节点编号,包括:
[0033]当前医疗机构基于中心机的指令生成随机数和随机质数,并向其他医疗机构请求公钥;
[0034]当前医疗机构基于获得的公钥对随机数和随机质数进行加密,并将加密结果发送至其他医疗机构,使得其他医本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于隐私保护下局部图信息交换的中心疾病预测方法,其特征在于,包括:(1)对每个医疗机构的关系图的节点字符进行保密编码得到对应的节点编号,并构建由节点编号表示节点的关系图;(2)每个医疗机构具有本地图卷积神经网络,本地图卷积神经网络包括多层图卷积模块,图卷积模块用于基于当前医疗机构的关系图聚合当前医疗机构节点的邻居节点特征得到本地聚合结果,基于其他医疗机构的关系图通过节点编号对当前医疗机构节点的异地邻居节点特征进行加密聚合得到异地聚合结果,结合本地聚合结果和异地聚合结得到向量图卷积表示,将激活后的向量图卷积表示输入下一层图卷积模块,通过多层图卷积模块运算得到预测疾病类别,基于预测疾病类别和真实疾病类别计算损失函数,并采用梯度下降法训练本地图卷积神经网络;(3)多个医疗机构同步完成本地图卷积神经网络的训练,联邦聚合训练后得到的参数获得聚合参数,若聚合参数使得全局图卷积神经网络收敛,则将聚合参数发送至各本地图卷积神经网络得到疾病预测模型;(4)若不收敛则将聚合参数输入各本地图卷积神经网络重复步骤(2)

(3),直至得到的聚合参数使得全局图卷积神经网络收敛;(5)将患者的节点编号向量输入疾病预测模型得到预测疾病类别。2.根据权利要求1所述的基于隐私保护下局部图信息交换的中心疾病预测方法,其特征在于,基于其他医疗机构的关系图通过节点编号对当前医疗机构节点的异地邻居节点特征进行加密聚合得到异地聚合结果,包括:基于其他医疗机构对应的关系图的节点度数矩阵和单位矩阵,其他医疗机构中与当前医疗机构对应层的图卷积模块的线性变换层参数,以及连接关系矩阵,同时引入差分隐私以获得局部图中间结果;基于其他医疗机构的关系图的节点编号得到当前医疗机构和其他医疗机构对应关系图的节点间的连接关系矩阵;基于当前医疗机构对应的节点的嵌入向量表示、当前医疗机构对应的关系图的节点度数矩阵和单位矩阵和多个其他医疗机构对应的多个局部中间结果获得异地聚合结果。3.根据权利要求2所述的基于隐私保护下局部图信息交换的中心疾病预测方法,其特征在于,在第t层图卷积模块,当前医疗机构j相对于其他医疗机构i的局部图中间结果为:其中,A
ij
为当前医疗机构i与其他医疗机构j的节点的连接关系矩阵,D
j
为其他医疗机构j对应的关系图的节点度数矩阵,I为单位矩阵,Laplace(0,λ)为零均值的拉普拉斯噪声,λ为拉普拉斯噪声的强度,为其他医疗机构j的第l层图卷积模块的线性变换层r的线性变换层参数。4.根据权利要求3所述的基于隐私保护下局部图信息交换的中心疾病预测方法,其特征在于,在第l层图卷积模块,当前医疗机构i异地聚合结果为:
其中,D
i
为当前医疗机构i对应的关系图的节点度数矩阵,U
i
为当前医疗机构i的节点编号的嵌入向量表示。5.根据权利要求2所述的基于隐私保护下局部图信息交换的中心疾病预测方法,其特征在于,基于其他医疗机构的关系图得到当前医疗机构和其他医疗机构对应的节点编号的连接关系矩阵,包括:基于其他医疗机构的关系图的节点编号,获得当前医疗机构的节点与其他医疗机构的节点的连接关系,即当前医疗机构的节点与其他医疗机构的节点存在连边则在连接关系矩阵中对应位置的值标记为1,不存在连边则在连接关系矩阵中对应位置的值标记为0,从而构建连接关系矩阵。6.根据权利要求1所述的基于隐私保护下局部图信息交换的中心疾病预测方法,其特征在于,基于当前医疗机构的关系图聚合当前医疗机构节点的邻居节点特征得到本地聚合结果,包括:基于当前医疗机构的关系图的节点度数矩阵和单元矩阵对邻接关系矩阵进行归一化...

【专利技术属性】
技术研发人员:张航池胜强李劲松田雨周天舒
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1