当前位置: 首页 > 专利查询>之江实验室专利>正文

一种基于因果结构不变性的多中心慢性病预测装置制造方法及图纸

技术编号:38194905 阅读:9 留言:0更新日期:2023-07-20 21:15
本发明专利技术公开了一种基于因果结构不变性的多中心慢性病预测装置,包括以下步骤,根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构;通过因果结构建立更为直观的因果结构图;通过因果结构图构建慢性病结局预测模型。本发明专利技术挖掘数据中更深层次的因果逻辑关系,解决了传统方法可解释性不足的问题,为慢性病决策支持提供更加合理的决策建议。决策建议。决策建议。

【技术实现步骤摘要】
一种基于因果结构不变性的多中心慢性病预测装置


[0001]本专利技术属于医疗健康信息
,尤其涉及一种基于因果结构不变性的多中心慢性病预测装置。

技术介绍

[0002]近年来,慢性病发病率呈现上升趋势, 严重影响居民健康和生活质量,造成巨大疾病负担。根据世界卫生组织最新数据显示,2019年全球死于慢性病的人数高达4100万,占全球死亡人数的74%;并且慢性病占前十大死亡原因的80%,占全球年死亡数的44%。我国慢性病患病和发病率亦呈快速上升之势,2019年我国居民因心脑血管疾病、癌症、慢性呼吸系统疾病和糖尿病等四类重大慢性病导致的过早死亡率为16.5%。因此,对慢性病发病风险进行早期预测,以便积极采取干预措施,对疾病的防控工作十分重要。
[0003]随着人工智能技术的不断发展,机器学习和深度学习的算法被广泛应用于健康医疗领域。现有的慢性病诊断及预测方法主要使用支持向量机、逻辑回归、朴素贝叶斯等基于机器学习的方法。比如利用传感器和年龄等数据,通过支持向量机方法预测肺癌分期情况;利用基因表达信息,通过随机森林、k近邻方法进行慢性肝炎阶段分析等。然而在现实生活中,由于地域、人口、干预类型、数据统计方法等方面的差异,导致医疗中心之间的数据具有异质性。若直接使用这些方法对异质性数据进行跨中心分析,会导致相同模型针对不同地域、不同医疗中心的预测结果差异较大。然而同一个场景的医学决策问题的内在的因果关联应该是稳定的,不应随数据分布差异而变化。
[0004]传统机器学习方法基于相关关系拟合函数与数据,无法区分临床特征与疾病发生之间具有因果关系还是伪相关关系。基于伪相关关系构建的模型系统,无法解释其预测背后真正的原因。传统的可解释性方法,如变量重要性方法SHAP,可以通过计算SHAP值来细分预测结果,评估每个特征对结果的影响程度。
[0005]公告号为CN106169165B的中国专利技术专利公开了一种面向诊疗数据的症状层次关联及预测方法,该方法基于层次主题模型构建症状主题层次空间,采用最大概率准则实现诊疗记录及病人的层次化映射,并综合考虑病人的诊疗地点、年龄、性别、时间多种属性信息实现疾病的动态预测。
[0006]公布号为CN113744870A的中国专利技术专利申请公开了一种病案首页主要诊断预测系统及方法,该系统从数据库中提取病人关联的临床数据,对病人关联的临床数据进行数据清洗与特征构建,获得病人关联的特征,存入建模样本库;然后根据病人关联的特征对病人进行第一轮分组,获得病人关联第一轮分组标识;针对每个第一轮分组分别生成对应的病案首页主要诊断预测模型;当所述系统接收到主要诊断预测请求时,依据请求携带的新增病人标识,依次通过数据组织模块和人群分组模块,获得新增病人关联第一轮分组标识,然后调用该第一轮分组标识对应的主要诊断预测模型,获得该新增病人的主要诊断预测结果。
[0007]这些方法仅针对独立变量对结局的影响进行相关性的解释,缺乏对变量与结果之
间因果结构的解释性分析。

技术实现思路

[0008]为了解决现有技术的不足,本专利技术提供了一种基于因果结构不变性的多中心慢性病预测装置,通过多层图神经网络挖掘数据中更深层次的因果逻辑关系,并通过因果结构表示模块进行了因果关系的可视化展示,解决了传统方法可解释性不足的问题,为慢性病决策支持提供更加合理的决策建议。
[0009]一种基于因果结构不变性的多中心慢性病预测装置,包括以下步骤:
[0010]步骤1,采集数据:采集不同医疗中心慢性病患者的数据;
[0011]步骤2,数据预处理:将步骤1得到患者数据进行预处理,对齐不同医疗中心具有相同语义概念、不同表述的特征,建立多中心患者的特征数据集合和多中心患者的结局集合;
[0012]步骤3,得到多中心场景下稳定的因果结构矩阵:根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构矩阵;
[0013]步骤4,因果结构矩阵转化:通过因果结构矩阵建立更为直观的因果结构图;
[0014]步骤5,预测结局:通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。
[0015]优选地,在步骤3中,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系通过图神经网络训练进行。
[0016]进一步地,图神经网络为二层网络结构,第一层神经网络逐一将单个中心患者的特征数据集合与随机初始化的该中心因果关系卷积,激活后得到第一层网络输出,第二层图神经网络将该中心因果关系与第一层网络输出卷积,激活后得到第二层网络输出,两层图神经网络后接全连接网络,激活后得到拟合结局,其中的网络参数和因果关系使用优化器优化。
[0017]进一步地,修正采用公式为:
[0018][0019][0020][0021][0022]其中,c为医疗中心个数,为第i个医疗中心患者人数,为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0,为第i个医疗中心第j个患者的数据经过模型后的拟合结局,为多中心拟合结局,Y为多中心实际结局,为多中心拟合结局和实际结局的差异,表示不同医疗中心的因果关系的方差,为不同中心因果关系的差异。
[0023]优选地,在步骤3中,当拟合误差和不同中心因果关系之间的差异达到预设要求
时,因果关系通过异质性映射反推得出因果结构矩阵,其中表示不同医疗中心的因果关系。
[0024]优选地,在步骤4中,通过因果结构矩阵建立更为直观的因果结构图的具体方法为:因果结构矩阵的中位数为,如果因果结构矩阵中第i行第j列的元素,则代表特征j是特征i的原因,在因果结构图中特征i与特征j构成j指向i的单向边,若则特征i与特征j不构成因果关系。
[0025]优选地,在步骤5中,通过因果结构图构建慢性病结局预测模型的具体方法为:构建大小N*N的全局邻接矩阵,其中,如果因果结构图中特征i与特征j构成j指向i的单向边,则第i行第j列的元素为1,否则为0;利用全局邻接矩阵构建2层图卷积神经网络,用于预测患者慢性病结局的发生情况。
[0026]进一步地,利用全局邻接矩阵构建2层图卷积神经网络,用于预测患者慢性病结局的发生情况,采用公式如下:
[0027][0028][0029]其中,为患者的特征数据,为患者慢性病的预测结局,ReLU()、为激活函数,、为可训练的网络参数,的计算公式为:
[0030][0031][0032]为的度数矩阵,为单位对角矩阵。
[0033]进一步地。通过损失使用交叉熵,来更新、,损失的具体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于因果结构不变性的多中心慢性病预测装置,其特征在于,包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码,以实现以下步骤:步骤1,采集数据:采集不同医疗中心慢性病患者的数据;步骤2,数据预处理:将步骤1得到患者数据进行预处理,对齐不同医疗中心具有相同语义概念、不同表述的特征,建立多中心患者的特征数据集合和多中心患者的结局集合;步骤3,得到多中心场景下稳定的因果结构矩阵:根据单个中心患者特征数据与其结局,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系,当拟合误差和不同中心因果关系之间的差异达到预设要求时,该因果关系经噪声处理后得到多中心场景下稳定的因果结构矩阵;步骤4,因果结构矩阵转化:通过因果结构矩阵建立更为直观的因果结构图;步骤5,预测结局:通过因果结构图构建慢性病结局预测模型,将患者的特征数据输入预测模型后得出慢性病的预测结局。2.根据权利要求1所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述步骤3中,建立每个中心的因果关系,使患者的特征数据在该因果关系下拟合其结局,根据患者的特征数据在该因果关系下的拟合结局对比实际结局的差异性,与不同医疗中心的因果关系之间的差异性共同修正该因果关系通过图神经网络训练进行。3.根据权利要求2所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述图神经网络为二层网络结构,第一层神经网络逐一将单个中心患者的特征数据集合与随机初始化的该中心因果关系卷积,激活后得到第一层网络输出,第二层图神经网络将该中心因果关系与第一层网络输出卷积,激活后得到第二层网络输出,两层图神经网络后接全连接网络,激活后得到拟合结局,其中的网络参数和所述的因果关系使用优化器优化。4.根据权利要求2所述的基于因果结构不变性的多中心慢性病预测装置,其特征在于,所述的修正采用公式为:;;;;其中,c为医疗中心个数,为第i个医疗中心患者人数,为第i个医疗中心第j个患者的实际结局,发生表示1,未发生表示0,为第i个医疗中心第j个患者的数据经过模型后的拟合结局,为多中心拟合结局,Y为多中心实际结局,为多中心拟合结局和实际结局的差异,表示不同医疗中心的因果关系的方差,为不同中心因果关系的差异。5.根据权利要求1所述的基于因...

【专利技术属性】
技术研发人员:王丰李劲松池胜强谭笑周天舒
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1