一种基于联邦学习重大传染病联合风险评估方法技术

技术编号:34091044 阅读:65 留言:0更新日期:2022-07-11 21:11
本发明专利技术公开一种基于联邦学习重大传染病联合风险评估方法,本发明专利技术采用联邦学习方法,将算法下放到本地节点,实现数据的本地计算。同时,本发明专利技术研究形成了跨区域的联合风险评估模型,在保障“疫情隐私数据可用不可见”的前提下,保障双方数据、模型、结果、任务的安全,开展跨区域的联合风险评估,为疫情的跨区域联防联控提供支持。本发明专利技术解决了个人信息收集、处理和联合分析过程中存在的个人隐私数据泄露、数据安全等问题,并基于联邦学习的方法提出了跨区域重大传染病疫情联防联控方案,并在此基础上提出了在疫情防控领域基于联邦学习的隐私安全计算解决方案。本发明专利技术能够实现跨区域的联合风险评估,为重大传染病疫情精细化防控和管理提供新思路。理提供新思路。理提供新思路。

【技术实现步骤摘要】
一种基于联邦学习重大传染病联合风险评估方法


[0001]本专利技术涉及一种重大传染病联合风险评估方法,具体涉及一种在联邦学习框架下实现数据隐私计算技术,在不泄露隐私数据的情况下实现联合风险评估分析的方法。

技术介绍

[0002][0003]近年来,随着大数据和人工智能、隐私计算等新一代信息技术的不断成熟和应用,隐私计算技术作为一种新兴技术体系,可以在保护数据隐私的前提下实现数据价值挖掘。目前,联邦学习在金融保险、智慧零售等领域已有广泛的应用,然而,在重大传染病风险研判预警、联防联控方面,联邦学习尚未形成较为成熟的应用案例。

技术实现思路

[0004]本专利技术的目的是:将联邦学习应用在针对重大传染病疫情的联合防控中。
[0005]为了达到上述目的,本专利技术的技术方案是提供了一种基于联邦学习重大传染病联合风险评估方法,其特征在于,包括以下步骤:
[0006]步骤1、通过部署于各地区疾控中心的本地节点获取疫情数据,将所有疫情数据汇集至数据层;
[0007]步骤2、采用联邦学习框架的技术支撑层,获取数据层中的疫情数据后对其进行联邦学习统计分析;技术支撑层利用数据准备模块对所获得的疫情数据进行数据融合,并定义实现多个本地节点进行多方交互的数据变量,技术支撑层还利用数据准备模块进行算法及协议选择,其中:算法为基于各地区疾控中心业务需要集成在模型算法层的模型算法,数据准备模块从模型算法层中选择需要使用的模型算法;
[0008]步骤3、技术支撑层利用数据预处理模块对数据准备模块输出的数据进行描述性统计和特征工程,以实现进一步的精细化处理;对于精细化处理后的数据,数据预处理模块基于同态加密的方式,进行初步的统计分析,获得多变量时间序列;
[0009]步骤4、技术支撑层的模型预测模块基于联邦学习框架,抽取各地疾控中心数据(包括确诊病例诊疗数据、密接者监测数据、密接者流调数据等),采用 XGboost算法在各机构本地进行子模型训练,每个本地节点获得各自的子模型后,利用各子模型输出预测结果,随后基于数据准备模块所选择的协议,整合各本地节点已训练的子模型的预测结果,并采用多方安全计算同态加密算法将各子模型的预测结果融合输出,从而融合形成联合风险评估模型;
[0010]步骤5、由模型算法层对联合风险评估模型进行模型评估和模型管理,并将最后的联合风险评估模型发布至应用层;
[0011]步骤6、应用层将联合风险评估模型通过API结构进行应用输出,以针对各地疾控中心所需疫情防控业务的应用支撑开展相关场景的应用。
[0012]优选地,步骤1中,所述各地区疾控中心的疫情数据包括公开可共享的数据以及涉
及隐私不可共享的数据。
[0013]优选地,步骤2中,所述协议为包含安全认证协议、节点互联协议、算法组件互联协议和联合建模协同协议为一体的多节点协同和互认协议。
[0014]优选地,步骤4中,取各子模型的预测结果的算数平均数为模型最终预测结果,然后将加密后的加法计算的结果进行解密,作为最终的联合风险评估模型的输出。
[0015]本专利技术采用联邦学习方法,将算法下放到本地节点,实现数据的本地计算。同时,本专利技术研究形成了跨区域的联合风险评估模型,在保障“疫情隐私数据可用不可见”的前提下,保障双方数据、模型、结果、任务的安全,开展跨区域的联合风险评估,为疫情的跨区域联防联控提供支持
[0016]本专利技术解决了个人信息收集、处理和联合分析过程中存在的个人隐私数据泄露、数据安全等问题,并基于联邦学习的方法提出了跨区域重大传染病疫情联防联控方案,并在此基础上提出了在疫情防控领域基于联邦学习的隐私安全计算解决方案。本专利技术能够实现跨区域的联合风险评估,为重大传染病疫情精细化防控和管理提供新思路。
附图说明
[0017]图1为联合风险评估系统技术架构图;
[0018]图2为跨区域疫情分析算法流程图。
具体实施方式
[0019]下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0020]本专利技术基于联邦学习框架,建立跨区域疫情联防联控平台架构,形成跨区域的联合风险评估模型,在本地节点并行计算过程,通过对相关协议的执行,保障双方数据、模型、结果、任务的安全,在保障“疫情隐私数据可用不可见”的前提下,开展跨区域的联合风险评估,为疫情的跨区域联防联控提供支持,帮助疫情监管部门等在保证数据安全、隐私数据不泄露的情况下,充分挖掘大数据中存在的价值,助力疫情常态化监管,有效保障公民个人隐私安全和国家公共治理能力。
[0021]具体而言,本专利技术提供的一种基于联邦学习重大传染病联合风险评估方法,包括以下步骤:
[0022]步骤1、获取各地区疾控中心的疫情数据,将所有疫情数据汇集至数据层。本专利技术中,各地区疾控中心的疫情数据包括各地区疾控中心抽取本地病例基本信息、发病治疗与转诊情况、流行病学史、样本采集与实验室检测数据,其中包含了公开可共享的数据以及涉及隐私不可共享的数据。
[0023]步骤2、采用联邦学习框架的技术支撑层,获取数据层中的疫情数据后对其进行联邦学习统计分析。技术支撑层首先利用数据准备模块对所获得的疫情数据进行数据融合,并定义实现多个本地节点进行多方交互的数据变量,技术支撑层还利用数据准备模块进行算法及协议选择,其中:算法为基于各地区疾控中心业务需要集成在模型算法层的常用模
型算法,数据准备模块从模型算法层中选择需要使用的模型算法;协议为包含安全认证协议、节点互联协议、算法组件互联协议和联合建模协同协议为一体的多节点协同和互认协议。
[0024]本专利技术中,针对疫情防控的特点和需求,可以对模型算法层的常用模型算法进行定向优化,形成面向跨区域联防联控的新模型,以支撑疫情防控相关业务的建设,具体优化方式由本领域技术人员根据实际业务需求进行,此处不再赘述。
[0025]步骤3、技术支撑层利用数据预处理模块对数据准备模块输出的数据进行描述性统计和特征工程等,以实现进一步的精细化处理。对于精细化处理后的数据,数据预处理模块基于同态加密的方式,进行初步的统计分析,获得多变量时间序列。
[0026]步骤4、技术支撑层的模型预测模块基于联邦学习框架,抽取各地疾控中心确诊病例诊疗数据、密接者监测数据、密接者流调数据等,采用XGboost算法在各机构本地进行子模型训练。每个本地节点获得各自的子模型后,利用各子模型输出预测结果,随后基于数据准备模块所选择的协议,整合各本地节点已训练的子模型的预测结果,并采用多方安全计算同态加密算法将各子模型的预测结果融合输出,从而融合形成联合风险评估模型。本实施例中,取各子模型的预测结果的算数平均数为模型最终预测结果,然后将加密后的加法计算的结果进行解密,作为最终的联合风险评估模型的输出。
[0027]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习重大传染病联合风险评估方法,其特征在于,包括以下步骤:步骤1、通过部署于各地区疾控中心的本地节点获取疫情数据,将所有疫情数据汇集至数据层;步骤2、采用联邦学习框架的技术支撑层,获取数据层中的疫情数据后对其进行联邦学习统计分析;技术支撑层利用数据准备模块对所获得的疫情数据进行数据融合,并定义实现多个本地节点进行多方交互的数据变量,技术支撑层还利用数据准备模块进行算法及协议选择,其中:算法为基于各地区疾控中心业务需要集成在模型算法层的模型算法,数据准备模块从模型算法层中选择需要使用的模型算法;步骤3、技术支撑层利用数据预处理模块对数据准备模块输出的数据进行描述性统计和特征工程,以实现进一步的精细化处理;对于精细化处理后的数据,数据预处理模块基于同态加密的方式,进行初步的统计分析,获得多变量时间序列;步骤4、技术支撑层的模型预测模块基于联邦学习框架,抽取各地疾控中心数据,采用XGboost算法在各机构本地进行子模型训练;每个本地节点获得各自的子模型后,利用各子模型输出预测结果,随后基于数据准备模块所选择的协议,...

【专利技术属性】
技术研发人员:童庆张文娟张琳梦代辉张天驰陈诚赵晓静
申请(专利权)人:万达信息股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1