一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统技术方案

技术编号:24829034 阅读:19 留言:0更新日期:2020-07-10 18:47
本发明专利技术公开了一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,该方法包括以下步骤:从医院电子病历系统获取心衰病人原始数据集;对获取的数据集进行特征工程预处理,其中包括对取得的原始数据集进行独热编码映射,得到疾病相关信息特征集,与原始数据集中的病人心衰死亡标签构成相应的病人心衰死亡数据集;在该数据集上基于卡方相关性分析进行特征重排,将特征按与病人心衰死亡相关性的大小,从高到低降序排列,并筛选出重排特征子集;利用卷积神经网络进行病人心衰死预测的训练本发明专利技术有益于辅助心衰疾病诊疗,改善病人的临床看护情况。

【技术实现步骤摘要】
一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统
本专利技术涉及人工智能辅助医疗决策领域,特别是涉及一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统。
技术介绍
心力衰竭是一种严重的心脏类疾病,具有高发病率和高死亡率的特点,近年来心力衰竭症状成为老年人入院看护的主要原因之一。有数据表明,心力衰竭这一疾病的两性患病率约为2.5%左右,其中有39.4%的人为超过60岁的老年人。根据美国心血管疾病报告的结果显示,从2012年到2030年,预计老年人心力衰竭的患病率将增加46%,而这会导致约800万心衰病人的增长。在中国,心力衰竭也是心血管疾病中导致住院的常见诱因之一,自20世纪70年代以来,心力衰竭及其住院治疗的病患数量迅速增加,心力衰竭流行率的增长也必然将导致其死亡率的上升。但是,心力衰竭这一疾病的防患效果远大于治疗效果。对于心力衰竭死亡风险的早期发现,可以辅助医生进行相应的医疗决策,提高这类病患的看护周期,从而进一步降低罹患心力衰竭病人的死亡率。也就是说,对于心力衰竭死亡风险的早期发现,一方面可以辅助医院进行医疗资源的倾斜,另一方面有助于延长心理衰竭病人的生命。近年来,随着机器学习的快速发展,人工智能的应用已经扩展到各个领域,如供应链需求分析,神经影像学,蛋白质组学,电子测试,饮食结构研究,人类服务以及基因组学。过去的研究表明,机器学习在不同领域的迁移应用,都起到了积极的作用。而随着机器学习的更进一步发展,深度学习技术应运而生。深度学习技术有着对大规模数据处理能力强,对图像识别敏感,对多源数据迁移学习能力高效的特定,由于深度学习技术的这些特点,越来越多的医学领域的研究人员都尝试引入深度学习方法来协助进行医学研究。例如,研究人员已将贝叶斯网络引入卫生保健领域,引入深度学习方法来分析医学图像,用决策树来对疾病进行分类等等。而这其中,卷积神经网络已被证明在医学图像分析和生物医学自然语言处理中出类拔萃的效果。对于一些简单的医学图像识别任务,深度学习的结果甚至已经超越了人类自身的辨识能力,而所有这些研究都表明了将机器学习尤其是深度学习方法应用于医学领域的必要性和可能性。对于心力衰竭这一疾病,已经有大量的研究者将多种传统机器学习建模的技术应用于心力衰竭的早期发现,这些机器学习建模技术包括了逻辑回归,多层感知机,支持向量机等等。然而前人的研究依然存在着一定的不足之处:前人的研究往往忽略了影响心力衰竭这一疾病的特征之间存在一定的相关性,因而没有给机器学习建模技术以足够的结构信息;心力衰竭疾病数据中往往存在着不平衡性,这是由于疾病重症病人的病例是少数的,而这正是影响心衰死亡风险预测的最大阻碍。针对这两个问题,我们提出了一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,在其中引入了特征重排来挖掘数据中的结构信息,并且引入了深度学习技术中的一维神经网络来处理较大大规模的数据,与此同时,通过将搭建的神经网络损失调整为聚焦损失(Focalloss)来缓解心力衰竭疾病中的数据不平衡问题,提高少数类的检出率。这一基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统最终得以辅助医院的医疗决策,帮助发现有因心力衰竭死亡风险的病人,改善他们的医护周期,从而延长这类病人的生命。
技术实现思路
心力衰竭是一种常见心血管疾病,在各个年龄层中都有发现;心力衰竭的特点是发病快、难根治、需预防,医学上对于心力衰竭发生的预测还较为欠缺,而当心力衰竭发生时,往往会危害患者的生命,严重时甚至会导致死亡。因此,对于心力衰竭病患死亡风险的预测有着巨大的应用价值;近年来,机器学习技术被广泛应用于疾病诊断和预防,心力衰竭作为一个常见病,也亟需相应的方法来进行诊断;另一方面,医学数据有着高维性和难表示的特点,且病患样本的分布往往不平衡,这些都为机器学习分类带来了困难。针对医学数据的特点,为了达到对心力衰竭病患死亡风险预测的目的,本专利技术提供了一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统。本专利技术解决其技术问题所采用的技术方案,从医院电子病历系统获取心衰病人原始数据集,对获取的心衰病人原始数据集进行特征工程预处理,其中包括对取得的原始数据集按照四个类别即常规,诊断,疾病,实验检验,分别进行数值化映射,将映射后的四大类特征子集与原始数据集中表示病人是否因心力衰竭死亡的标签组合,得到疾病相关信息特征集。通过提出重排滑窗卷积方法,对获取的疾病相关信息特征计算标签相关性,根据标签相关性进行约减特征重排操作,生成新的重排特征子集。搭建卷积神经网络模型,将得到的重排特征子集输入该模型,利用滑窗卷积运算,生成基于重排特征子集的抽象特征,再利用这些特征,训练出网络相应的参数。为网络引入焦点损失,使得神经网络更偏好难分类样本和患病样本的挖掘,进一步提高分类器的判别精确度。测试过程中,利用训练好的模型上线到病人心衰死亡风险预测系统,辅助疾病诊疗。本专利技术解决其技术问题所采用的技术方案还可以进一步完善。对于输入的心衰病人原始数据,通过特征工程的手段进行预处理,对四个类别即常规,诊断,疾病,实验检验的特征统计各特征的类别数,统计每一种类别型特征包含的类别数量K,将该类别特征进行独热编码映射,得到对应的独热编码,将每一类别特征都用其独热编码进行重新表示。将映射后的四大类特征子集与原始数据集中表示病人是否因心力衰竭死亡的标签组合,得到疾病相关信息特征集。进一步对获取的疾病相关信息所有特征计算标签相关性,根据特征的不同得分,降序重新排列所有的特征,选择其中排名靠前的特征构造重排特征子集。搭建卷积神经网络模型,将得到的重排特征子集输入该模型,利用滑窗卷积运算,生成基于重排特征子集的抽象特征,再利用这些特征,训练出网络相应的参数。为网络引入焦点损失,使得神经网络更偏好难分类样本和患病样本的挖掘,进一步提高分类器的判别精确度。测试过程中,将测试子集输入到训练好的网络中,得到测试集上病人是否会因心力衰竭死亡的预测标签,评估所得网络对病人心衰死亡风险预测的精准程度。本专利技术有益的效果是:利用特征重排卷积生成更优的带序特征组合,结合焦点损失和多层神经网络,通过多轮迭代训练和参数优化,设计出预测心力衰竭病患死亡风险的神经网络分类方法。该方法针对实际医学问题,利用深度学习方法,缓解了医学数据的不平衡、难表示,并且得到了良好分类结果,可以被用于辅助疾病诊疗,预测心力衰竭病患的死亡风险。附图说明图1是本专利技术整体流程图。图2是本专利技术的网络框架图;具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述。本专利技术提供了一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,包括以下部分:第一步:从医院的电子病历系统提取罹患心力衰竭的病人脱敏记录。这些提取的记录应遵循以下准则:(1)提取的记录应包含ICD-10-CM中关于心力衰竭疾病的相关症状及治疗诊断。(2)提取的记录所涉及的病人应在住院的前两天内至少有使用过一种对心力衰竭的治疗方法。(3)要求按照“住院中、出本文档来自技高网
...

【技术保护点】
1.一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,其特征在于,包括以下步骤:/nS1,从医院电子病历系统获取心衰病人原始数据集,对获取的心衰病人原始数据集进行特征工程预处理,其中包括对取得的原始数据集按照四个类别即常规,诊断,疾病,实验检验,分别进行数值化映射,将映射后的四大类特征子集与原始数据集中表示病人是否因心力衰竭死亡的标签组合,得到疾病相关信息特征集X

【技术特征摘要】
1.一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,其特征在于,包括以下步骤:
S1,从医院电子病历系统获取心衰病人原始数据集,对获取的心衰病人原始数据集进行特征工程预处理,其中包括对取得的原始数据集按照四个类别即常规,诊断,疾病,实验检验,分别进行数值化映射,将映射后的四大类特征子集与原始数据集中表示病人是否因心力衰竭死亡的标签组合,得到疾病相关信息特征集XD。
S2,提出重排滑窗卷积方法,对获取的疾病相关信息特征XD计算标签相关性,根据标签相关性进行约减特征重排操作,生成新的重排特征子集Xd,其中d∈D。
S3,搭建神经网络模型,将得到的重排特征子集Xd输入该模型,训练出相应的参数,利用训练好的模型上线到病人心衰死亡风险预测系统,辅助疾病诊疗。


2.根据权利要求1所述的一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,其特征在于,步骤S1包括以下步骤:
S11,对获取的心衰病人原始数据集特征进行归类,将其分为常规,诊断,疾病,实验测试四大特征。
S12,对于常规,诊断,疾病,实验测试这四大特征,统计每一种特征包含的类别数量K,将该类别特征进行独热编码映射,得到1×K的独热编码,将每一类别特征都用其独热编码进行重新表示,其中诊断特征和疾病特征被映射为{0,1},用0表示阴性,1表示阳性,检验映射为{(1,0,0),(0,1,0),(0,0,1)}的独热集,其中(1,0,0)表示检验水平低,(0,1,0)检验水平正常,(0,0,1)表示检验水平超标。
S13,将映射后的四大类特征子集与原始数据集中表示病人是否因心力衰竭死亡的标签构成疾病相关信息特征集XD,其特征维度为D。


3.根据权利要求1所述的一种基于特征重排一维卷积神经网络的病人心衰死亡风险预测系统,其特征在于,步骤S2包括以下步骤:
S21,在疾病相关信息特征集XD上进行D维特征与表示病人是否因心力衰竭死亡标签的相关性的迭代计算,首先确定需要计算某一特征Xt,t∈D,设表示病人是否因心力衰竭死亡标签为Y,假设特征Xt的值域为{Xt1,Xt2,....},而标签Y的值域为{0,1},可列出样本频数矩阵



总计为r+1行c+1列的矩阵,其中每行为特征Xt取值,每列为标签Y的取值,最后一行、一列为每行每列的总和,利用以下的计算公式:
...

【专利技术属性】
技术研发人员:李冬冬王喆朱逸文杨海杜文莉张静
申请(专利权)人:华东理工大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1