当前位置: 首页 > 专利查询>之江实验室专利>正文

一种面向数据分布漂移检测与自适应的临床风险预测系统技术方案

技术编号:38380854 阅读:8 留言:0更新日期:2023-08-05 17:39
本发明专利技术公开了一种面向数据分布漂移检测与自适应的临床风险预测系统,包括:中心服务器和节点;中心服务器包括第一漂移检测模块和模型聚合模块;节点包括数据采集模块、第二漂移检测模块和模型更新模块;数据采集模块用于获取患者临床诊疗数据;第一漂移检测模块和第二漂移检测模块根据新/旧患者临床诊疗数据集是否来源于同一数据分布判定患者临床诊疗数据分布是否发生了漂移;当患者临床诊疗数据分布发生漂移时,训练本地临床风险预测模型,将其参数上传至中心服务器,对各个模型参数进行聚合,得到更新后的临床风险预测模型,并下发至各节点进行部署;将新患者临床诊疗数据输入至更新后的临床风险预测模型,得到临床风险预测结果。测结果。测结果。

【技术实现步骤摘要】
一种面向数据分布漂移检测与自适应的临床风险预测系统


[0001]本专利技术属于医疗健康信息
,尤其涉及一种面向数据分布漂移检测与自适应的临床风险预测系统。

技术介绍

[0002]在临床风险预测应用场景中,随着时间的推移,人口统计、疾病流行、临床实践和医疗保健系统作为一个整体可能会发生变化,数据的分布随时间发生不可预测的变化,使在旧数据集上建立的模型不再适用于新的数据。这意味着基于单中心静态截面数据的临床风险预测模型可能会过时或不适用于其他机构,导致预测结果不再准确。其次,临床风险预测模型应用于临床实践会改变临床决策和干预措施,导致新数据的结果分布和预测因子

结果关联关系变化,从而导致临床风险预测模型性能快速衰退。因此,临床风险预测模型在经过一段时间后,就要重新训练和部署。
[0003]尤其在肿瘤患者的预后风险预测场景,随着肿瘤检测手段进步、生物标记物发现、治疗方式改进,肿瘤患者的临床诊疗数据特征和临床观察结局分布在不断发生变化。这些因素促使用于肿瘤预后风险评估的临床风险预测模型进行必要的、及时的更新。
[0004]常用的模型自适应更新方法包括模型重训练、不同时间窗口的模型集成和增量学习三种。模型重训练需要消耗大量的计算资源和建模时间。不同时间窗口的模型集成需要维护一个模型池,对新数据同时进行打分,会消耗大量的计算资源。增量学习方法则存在灾难性遗忘现象,即随着时间的推移,模型使用最新的数据进行更新,新获得的数据往往会抹去之前学习到的模式。此外,模型重训练、模型集成和增量学习三种方式都需要指定固定的时间进行模型更新,可能会出现以下两种情况:
[0005]1. 更新时间间隔过小,没有累积到足够多具有差异分布的新数据,导致本次模型更新结果与上次结果相近,浪费系统计算资源;
[0006]2. 更新时间间隔过大,累积的新数据过多,导致模型更新滞后,新数据预测效果不佳。
[0007]因此,亟需提出一种临床风险预测系统,克服数据漂移带来的临床风险预测不准确。

技术实现思路

[0008]针对现有技术不足,本专利技术提供了一种面向数据分布漂移检测与自适应的临床风险预测系统。
[0009]根据本专利技术实施例的第一方面,提供了一种面向数据分布漂移检测与自适应的临床风险预测系统,所述系统包括中心服务器和若干个节点;
[0010]中心服务器包括:第一漂移检测模块和模型聚合模块;
[0011]节点包括:数据采集模块、第二漂移检测模块和模型更新模块;
[0012]数据采集模块,用于获取患者临床诊疗数据;
[0013]第一漂移检测模块和第二漂移检测模块,根据新患者临床诊疗数据集与初始患者临床诊疗数据集是否来源于同一数据分布判定患者临床诊疗数据是否发生了漂移;
[0014]当患者临床诊疗数据分布发生漂移时,通过模型更新模块训练本地临床风险预测模型,将训练好的本地临床风险预测模型的参数上传至中心服务器,通过模型聚合模块对各个节点的本地临床风险预测模型的参数进行聚合,得到更新后的临床风险预测模型,并下发至各节点进行部署;将新患者临床诊疗数据输入至更新后的临床风险预测模型,得到临床风险预测结果。
[0015]根据本专利技术实施例的第二方面,提供了一种面向数据分布漂移检测与自适应的临床风险预测装置,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的面向数据分布漂移检测与自适应的临床风险预测系统。
[0016]根据本专利技术实施例的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的面向数据分布漂移检测与自适应的临床风险预测系统。
[0017]与现有技术相比,本专利技术的有益效果为:
[0018](1)本专利技术将节点配置为只与中心服务器通信,各节点之间不通讯;同时,各节点只将本地临床风险预测模型的参数上传至中心服务器,不将原始患者临床诊疗数据集上传至中心服务器,使得本专利技术在数据安全和隐私保护前提下进行多中心的数据分布漂移检测与多中心的临床风险预测模型更新。
[0019](2)本专利技术在临床风险预测模型的训练过程中,基于新患者临床诊疗数据集与初始患者临床诊疗数据集的相似性确定模型参数相似性约束在损失函数中的权重。同时,模型参数相似性约束提炼旧模型中的知识,避免了模型更新中的灾难性遗忘现象,保持临床风险预测的准确性。
[0020](3)本专利技术在系统中有新患者临床诊疗数据产生时,进行及时的数据分布漂移检测。如果检测到了数据分布漂移,就对临床风险预测模型进行更新,如果没有检测到数据分布漂移,则保存数据用于下一次的数据分布漂移检测和临床风险预测模型更新。使得本专利技术可以在自动检测到数据分布漂移后,进行临床风险预测模型的更新,不需要为临床风险预测模型的更新预设时间间隔,提高临床风险预测的准确率,可以在实现及时的临床风险预测模型更新的前提下,有效减少计算资源的浪费。
附图说明
[0021]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0022]图1为本专利技术实施例提供的一种面向数据分布漂移检测与自适应的临床风险预测系统的示意图;
[0023]图2为本专利技术实施例提供的判定患者临床诊疗数据分布是否发生漂移的示意图;
[0024]图3为本专利技术实施例提供的多中心的临床风险预测模型更新的示意图;
[0025]图4为本专利技术实施例提供的一种面向数据分布漂移检测与自适应的临床风险预测装置的示意图。
具体实施方式
[0026]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0027]需要说明的是,在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。
[0028]如图1所示,本专利技术实施例提供了一种面向数据分布漂移检测与自适应的临床风险预测系统,所述系统包括:中心服务器和若干个与其通讯的节点;
[0029]中心服务器包括:第一漂移检测模块和模型聚合模块。
[0030]节点包括:数据采集模块、第二漂移检测模块和模型更新模块。
[0031]数据采集模块,用于获取并存储患者临床诊疗数据。所述患者临床诊疗数据包括患者的人口统计学信息、就诊信息、诊断、实验室检验、医学检查、手术、用药和随访信息;
[0032]第一漂移检测模块和第二漂移检测模块,根据新患者临床诊疗数据集与初始患者临床诊疗数据集是否来源于同一数据分布判定患者临床诊疗数据是否发生了漂移。
...

【技术保护点】

【技术特征摘要】
1.一种面向数据分布漂移检测与自适应的临床风险预测系统,其特征在于,所述系统包括中心服务器和若干个节点;中心服务器包括:第一漂移检测模块和模型聚合模块;节点包括:数据采集模块、第二漂移检测模块和模型更新模块;数据采集模块,用于获取患者临床诊疗数据;第一漂移检测模块和第二漂移检测模块,根据新患者临床诊疗数据集与初始患者临床诊疗数据集是否来源于同一数据分布判定患者临床诊疗数据是否发生了漂移;当患者临床诊疗数据分布发生漂移时,通过模型更新模块训练本地临床风险预测模型,将训练好的本地临床风险预测模型的参数上传至中心服务器,通过模型聚合模块对各个节点的本地临床风险预测模型的参数进行聚合,得到更新后的临床风险预测模型,并下发至各节点进行部署;将新患者临床诊疗数据输入至更新后的临床风险预测模型,得到临床风险预测结果。2.根据权利要求1所述面向数据分布漂移检测与自适应的临床风险预测系统,其特征在于,第一漂移检测模块和第二漂移检测模块,根据新患者临床诊疗数据集与初始患者临床诊疗数据集是否来源于同一数据分布判定患者临床诊疗数据分布是否发生了漂移包括:第二漂移检测模块计算数据质心并上传至中心服务器;第一漂移检测模块根据各节点上传的数据质心获取全局数据质心矩阵,并下发至各节点;第二漂移检测模块计算初始患者临床诊疗数据集中每条数据到所有数据质心的第一距离之和,得到节点距离最大值和节点距离最小值,并上传至中心服务器;第一漂移检测模块根据各节点上传的节点距离最大值和节点距离最小值,得到全局距离最大值和全局距离最小值;当节点上有新患者临床诊疗数据集产生时,第二漂移检测模块计算新患者临床诊疗数据集到所有数据质心的第二距离之和;当第二距离之和大于全局距离最大值,或第二距离之和小于全局距离最小值,则新患者临床诊疗数据集与初始患者临床诊疗数据集不是来源于同一数据分布,患者临床诊疗数据分布发生了漂移。3.根据权利要求2所述面向数据分布漂移检测与自适应的临床风险预测系统,其特征在于,第二漂移检测模块计算数据质心包括:数据质心每一维度的特征取值由初始患者临床诊疗数据集每一维度的特征计算得到;当初始患者临床诊疗数据集中的特征是分类变量,使用初始患者临床诊疗数据集中特征的众数作为数据质心对应特征的特征取值;当初始患者临床诊疗数据集中的特征是连续变量,使用初始患者临床诊疗数据集中特征的中位数或平均数作为数据质心对应特征的特征取值。4.根据权利要求2所述面向数据分布漂移检测与自适应的临床风险预测系统,其特征在于,第二漂移检测模块计算初始患者临床诊疗数...

【专利技术属性】
技术研发人员:李劲松池胜强王丰周天舒田雨
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1