System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于人工智能领域,具体涉及一种基于电子病历融合的icu患者早期预测方法及系统。
技术介绍
1、icu是医院医疗资源的重点服务对象。患者在进入icu后,有效的对患者状态进行早期预测,能够极大的提高医疗资源的使用效率,也能够极大的提高icu的可靠性和效率,因此意义重大。
2、目前,icu患者的早期预测内容包括了死亡率预测和表型分类预测。目前常用的预测方案,一般采用电子健康记录中记录的多变量时间序列和临床记录序列,来进行早期预测;但是这类预测方案忽略了临床记录间存在的时间不规则问题,可靠性和精确性都较差。随着机器学习方案的发展,近年来,越来越多的研究人员开始采用机器学习的方案来实现icu患者的早期预测;但是这类方案忽略了电子健康记录中的某些数据,而且电子健康记录中的不同模态数据间的不规则问题以及多模态数据之间的相关性和依赖关系问题,也使得现有的基于机器学习的患者早期预测方案,依旧存在可靠性差,精确性低的问题。
技术实现思路
1、本专利技术的目的之一在于提供一种可靠性高且精确性好的基于电子病历融合的icu患者早期预测方法。
2、本专利技术的目的之二在于提供一种实现所述基于电子病历融合的icu患者早期预测方法的系统。
3、本专利技术提供的这种基于电子病历融合的icu患者早期预测方法,包括如下步骤:
4、s1.获取现有的icu患者的电子病历数据;
5、s2.对步骤s1获取的数据进行分类预处理;
6、s3.基于注意
7、s4.采用步骤s2得到的预处理数据,对步骤s3构建的模型进行训练,得到训练后的icu患者早期预测模型;
8、s5.采用步骤s4得到的icu患者早期预测模型,进行实际的icu患者的早期预测。
9、步骤s1所述的现有的icu患者的电子病历数据,具体包括现有的mimic-iii的原始数据集。
10、步骤s2所述的分类预处理,具体包括如下步骤:
11、根据获取的数据信息,为每个患者id生成一个文件夹,将icu入住信息、诊断信息和事件分别建立文件并存储,同时删除缺少信息的事件;
12、将每个id的数据按照事件分解为片段,对事件的时间顺序进行单独存储,同时对事件的具体信息和结果进行存储;
13、对患者的id和笔记,进行非空过滤处理;将文本数据按照id和按照时间顺序进行分类,并保存;将处理后的时间序列与文本数据合并,完成最终的预处理过程。
14、步骤s3所述的基于注意力机制,构建icu患者早期预测初始模型,具体包括如下步骤:
15、构建的icu患者早期预测初始模型包括插值嵌入模块、文本处理模块、多模态融合模块和预测模块;
16、插值嵌入模块和文本处理模块的输出数据均输入到多模态融合模块,多模态融合模块的输出输入到预测模块,预测模块输出最终的预测结果;
17、所述的插值嵌入模块用于对分类预处理后的数据进行插值嵌入处理,得到不规则采样时间序列表示;
18、所述的文本处理模块用于对分类预处理后的数据采用长文本序列模型和注意力机制进行处理,得到不规则采样文本序列表示;
19、所述的多模态融合模块用于对得到的不规则采样时间序列表示和不规则采样文本序列表示,采用注意力机制进行多模态融合,得到多模态融合表示;
20、所述的预测模块用于将得到的多模态融合表示通过分类器,得到早期预测结果。
21、所述的对分类预处理后的数据进行插值嵌入处理,得到不规则采样时间序列表示,具体包括如下步骤:
22、分类预处理后的数据表示为其中为来自多变量不规则时间序列的数据,为序列的记录数值,为序列的记录时间,为临床笔记,为笔记的记录时间,为有记录时间的临床笔记,yi为待预测的标签,n为数据集中患者的总数;
23、采用如下步骤进行插值,得到插值嵌入eim:
24、根据序列时间ts将序列值xs离散到时间间隔序列上;
25、对于每个特征,若在同一个观测区间存在多于1个观测值,则采用最后一个观测值作为数据的最终值;若在一个观测区间内没有任何观测值,则标记为缺失;
26、针对被标记为缺失的区间,前一个最近的观测值作为当前的缺失区间的数据的最终值;若前一个最近的观测值同样确实,则将数据的全局平均值作为当前的缺失区间的数据的最终值;
27、最后,将时间序列输入到步长为1的一维因果卷积中,通过因果卷积关联数据间的时间关联性和局部特征,得到插值嵌入eim;
28、采用如下步骤进行嵌入,得到嵌入;值eta:
29、对每一个时间步,采用p个嵌入函数,每一个函数均为序列生成dr维表征;每一个函数p的维度表示定义为:
30、
31、式中φ(τ)[i]为时间点τ的第i个维度;ω0h为第一待学习参数;α0h为第二待学习参数;ωih为第三待学习参数;αih为第四待学习参数;
32、采用p个嵌入函数,生成连续时间嵌入;通过将序列p、ts和xs作为查询、键和值,在每个维度上获取与p对应的归因序列,并产生归因矩阵:
33、
34、
35、式中为多变量插值矩阵;为单变量插值序列;为序列时间嵌入;attention()为注意力机制计算函数;φp(α)为时间线的维度表示;为第一待学习参数;为第二待学习参数;为序列值;
36、最后,通过拼接p的估算矩阵,并进行线性映射,得到最终的嵌入eta;
37、采用如下步骤,得到不规则采样时间序列表示zs:
38、采用如下算式计算得到不规则采样时间序列表示zs:
39、zs=g⊙eim+(1-g)⊙eta
40、式中⊙为点积符号;g为维度特征,且为连接符号,f()为全连接门控函数。
41、所述的对分类预处理后的数据采用长文本序列模型和注意力机制进行处理,得到不规则采样文本序列表示,具体包括如下步骤:
42、针对分类预处理后的数据xn=[x1,x2,...,xn],置换产生n!个不同的排列组合z=[z1,z2,...,zn!],其中排列zn!出现的概率为p(zn!),模型的目标函数依据极大似然估计为:
43、
44、式中θ为所有因式分解阶次共享参数;z~z表示从z到z的排列;为因式分解概率;为文本的第t个元素;xz<t为文本前t-1个元素;
45、将目标函数简化为,其中m为采样方式;
46、在预测目标位置zt的token时,引入位置信息重新定义预测位置概率分布,表示为其中e(x)为表示x的嵌入;为转置,gθ(xz<t,zt)为将位置目标zt作为输入,e(x')为x'的嵌入,x'为所有可能出现的词;
47、采用双流自注意力机制提供内容方面的表达,表示为:
48、
<本文档来自技高网...【技术保护点】
1.一种基于电子病历融合的ICU患者早期预测方法,包括如下步骤:
2.根据权利要求1所述的基于电子病历融合的ICU患者早期预测方法,其特征在于步骤S1所述的现有的ICU患者的电子病历数据,具体包括现有的MIMIC-III的原始数据集。
3.根据权利要求2所述的基于电子病历融合的ICU患者早期预测方法,其特征在于步骤S2所述的分类预处理,具体包括如下步骤:
4.根据权利要求3所述的基于电子病历融合的ICU患者早期预测方法,其特征在于步骤S3所述的基于注意力机制,构建ICU患者早期预测初始模型,具体包括如下步骤:
5.根据权利要求4所述的基于电子病历融合的ICU患者早期预测方法,其特征在于所述的对分类预处理后的数据进行插值嵌入处理,得到不规则采样时间序列表示,具体包括如下步骤:
6.根据权利要求5所述的基于电子病历融合的ICU患者早期预测方法,其特征在于所述的对分类预处理后的数据采用长文本序列模型和注意力机制进行处理,得到不规则采样文本序列表示,具体包括如下步骤:
7.根据权利要求6所述的基于电子病历融合的ICU
8.根据权利要求7所述的基于电子病历融合的ICU患者早期预测方法,其特征在于所述的将得到的多模态融合表示通过分类器,得到早期预测结果,具体包括如下步骤:
9.一种实现权利要求1~8之一所述的基于电子病历融合的ICU患者早期预测方法的系统,其特征在于包括数据获取模块、数据处理模块、模型构建模块、模型训练模块和早期预测模块;数据获取模块、数据处理模块、模型构建模块、模型训练模块和早期预测模块依次串接;数据获取模块用于获取现有的ICU患者的电子病历数据,并将数据信息上传数据处理模块;数据处理模块用于根据接收到的数据信息,对获取的数据进行分类预处理,并将数据信息上传模型构建模块;模型构建模块用于根据接收到的数据信息,基于注意力机制,构建ICU患者早期预测初始模型,并将数据信息上传模型训练模块;模型训练模块用于根据接收到的数据信息,采用预处理数据,对构建的模型进行训练,得到训练后的ICU患者早期预测模型,并将数据信息上传早期预测模块;早期预测模块用于根据接收到的数据信息,采用得到的ICU患者早期预测模型,进行实际的ICU患者的早期预测。
...【技术特征摘要】
1.一种基于电子病历融合的icu患者早期预测方法,包括如下步骤:
2.根据权利要求1所述的基于电子病历融合的icu患者早期预测方法,其特征在于步骤s1所述的现有的icu患者的电子病历数据,具体包括现有的mimic-iii的原始数据集。
3.根据权利要求2所述的基于电子病历融合的icu患者早期预测方法,其特征在于步骤s2所述的分类预处理,具体包括如下步骤:
4.根据权利要求3所述的基于电子病历融合的icu患者早期预测方法,其特征在于步骤s3所述的基于注意力机制,构建icu患者早期预测初始模型,具体包括如下步骤:
5.根据权利要求4所述的基于电子病历融合的icu患者早期预测方法,其特征在于所述的对分类预处理后的数据进行插值嵌入处理,得到不规则采样时间序列表示,具体包括如下步骤:
6.根据权利要求5所述的基于电子病历融合的icu患者早期预测方法,其特征在于所述的对分类预处理后的数据采用长文本序列模型和注意力机制进行处理,得到不规则采样文本序列表示,具体包括如下步骤:
7.根据权利要求6所述的基于电子病历融合的icu患者早期预测方法,其特征在于所述的多模态融合模块用于对得到的不规则采样时间...
【专利技术属性】
技术研发人员:奎晓燕,丁宇婷,邹北骥,陈立明,李钦松,刘姝,
申请(专利权)人:中南大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。