System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于临床文本增强的患者表示方法及序列疾病预测装置、电子设备制造方法及图纸_技高网

基于临床文本增强的患者表示方法及序列疾病预测装置、电子设备制造方法及图纸

技术编号:42223344 阅读:15 留言:0更新日期:2024-08-02 13:41
本发明专利技术公开了一种基于临床文本增强的患者表示方法及序列疾病预测装置、电子设备,属于自然语言处理技术领域。本发明专利技术要解决的技术问题为如何利用临床文本增强患者表示,并实现序列疾病预测,采用的技术方案为:①一种基于临床文本增强的患者表示方法,该方法包括如下步骤:S301、就诊超图构建模块;S302、临床文本处理模块;S303、临床文本编码模块;S304、就诊超图学习模块;S305、患者表示模块。②一种基于临床文本增强的序列疾病预测装置,该装置包括:预处理数据集单元、构建训练数据集单元、序列疾病预测模型构建单元以及序列疾病预测模型训练单元。

【技术实现步骤摘要】

本方法涉及人工智能、自然语言处理,具体涉及一种基于临床文本增强的患者表示方法及序列疾病预测装置、电子设备


技术介绍

1、序列疾病预测是医疗领域中一项重要研究任务,其目的是根据患者历史就诊记录预测该患者下一次就诊将被诊断出的疾病。序列疾病预测不仅能够帮助患者进行疾病的早期预防,也可以帮助医生对特定患者制定个性化的治疗方案。随着深度学习技术的快速发展和广泛应用,越来越多的研究者关注利用神经网络模型学习患者历史就诊记录得到患者表示,并利用患者表示预测该患者下一次就诊将被诊断出的疾病。

2、近年来,许多传统的神经网络模型被应用于序列疾病预测。其中,基于循环神经网络和图神经网络的方法表现出一定的优势。然而,基于循环神经网络的预测方法只是将单次就诊被诊断出疾病的表示整合为就诊表示,不能捕捉单词就诊被诊断出疾病间的关系;而基于图神经网络的方法,可以将单次就诊被诊断出的疾病作为节点,疾病间的关系作为边,构建成图结构,并利用图神经网络捕捉疾病间的相互关系。但是,基于图神经网络的方法在充分利用临床文本信息方面,仍有待提高和完善。这些局限导致现有方法在捕捉患者病史信息和预测疾病发展方面的能力较差,难以满足医疗领域对高精度预测结果的需求。

3、因此,本方法首先根据患者单次就诊中被诊断出的疾病以及这些疾病间的共现关系,构建疾病超图,并使用超图神经网络以捕捉疾病间的高阶交互;设计三步思维链推理方法,利用大语言模型总结与患者健康状况相关的临床文本,并利用临床预训练语言模型进行编码,从而能够捕捉疾病间的高阶交互信息以及充分利用临床文本中与患者健康状况相关的信息。


技术实现思路

1、针对现有方法的不足,本方法提出一种基于临床文本增强的患者表示方法及序列疾病预测装置、电子设备。该方法将单次就诊中被诊断出的疾病作为节点,疾病间的关系作为超边,构建超图结构,并利用超图神经网络捕获疾病间的高阶相互作用,得到就诊表示;使用大语言模型提取临床文本中与患者相关的信息,并使用临床预训练语言模型进行编码,得到临床文本表示;将临床文本表示与就诊表示进行交互,得到患者表示;最后利用患者表示来预测该患者下一次就诊将被诊断出的疾病。

2、本方法的技术任务是按以下方式实现的,基于临床文本增强的患者表示方法,该方法具体如下:

3、对以下步骤中使用专有名词,解释如下:

4、序列疾病预测任务是指根据患者历史就诊记录预测患者下一次就诊诊断出的疾病;假设患者已有h-1次历史就诊,预测患者在第h次就诊时会被诊断出的疾病;

5、疾病共现关系:假如多种疾病在某次就诊记录中共同出现,则称它们具有共现关系;

6、疾病编码:对于患者的每次就诊,使用疾病编码将患者被诊断出的疾病记录到就诊记录中;其中一种疾病编码唯一对应着一种特定疾病;

7、病案号:在就诊记录中,患者每次就诊都会用一个唯一的病案号进行表示;

8、就诊记录字典:因为每位患者id可能有多次就诊记录,每次就诊都有一个唯一的病案号以及对应的就诊时间,将每次就诊的病案号和就诊时间组合成一个列表,称之为就诊列表;以患者id作为字典的键key,将按照就诊时间顺序排列的就诊列表作为字典的值value,创建就诊记录字典;

9、疾病编码字典:为每个疾病编码分配一个唯一的整数编码,构建疾病编码映射字典,其中疾病编码作为key,整数编码作为value;对于每个患者的每次就诊,将该患者就诊的病案号作为key,将诊断出的疾病对应的疾病编码转换为整数编码后,组成一个列表,称之为诊断疾病编码列表并作为value,构建每个患者的疾病编码字典;

10、临床文本字典:将该患者就诊的病案号作为key,将患者该就诊记录中的临床文本作为value,构建每个患者的临床编码字典;

11、s301、就诊超图构建模块:以预处理后的患者就诊记录作为输入,以单次就诊中被诊断出的疾病作为节点,就诊作为超边,构建疾病超图;初始化疾病超图中的节点特征,得到就诊超图,并将其输入至就诊超图学习模块;

12、s302、临床文本处理模块:以预处理后的患者就诊记录作为输入,设计三步思维链提示方法完成三项子任务提取临床文本中与患者健康状况相关的重要信息:捕捉临床文本中与被诊断出的疾病相关的关键词和术语、从临床文本中提取影响患者健康状况的相关部分内容、根据提取的内容总结临床文本,得到总结后的临床文本,并将其输入临床文本编码模块;

13、s303、临床文本编码模块:以s302临床文本处理模块得到的总结后的临床文本作为输入,使用临床预训练语言模型编码,得到临床文本嵌入表示,并将其输入至患者表示模块;

14、s304、就诊超图学习模块:以s301就诊超图构建模块得到的就诊超图作为输入,使用超图神经网络学习就诊超图中疾病间高阶交互关系,得到疾病上下文,并将其输入至患者表示模块;

15、s305、患者表示模块:以s304就诊超图学习模块得到的疾病上下文以及s303临床文本编码模块得到的临床文本嵌入表示作为输入;使用编码级别的注意力机制学习每种疾病的重要性,得到第h-1次就诊的就诊嵌入表示,并将第h-1次就诊的就诊嵌入表示与s303临床文本编码模块生成的临床文本嵌入表示,进行交互,得到第h-1次就诊表示;使用就诊级别的注意力机制学习历史每一次就诊表示的重要程度,得到患者表示。

16、作为优选,所述s301就诊超图构建模块的具体步骤如下:

17、就诊超图构建模块主要包括构建疾病超图与初始化疾病超图中的节点特征,具体步骤如下:

18、s30101、构建疾病超图:将预处理后的患者就诊记录作为输入,根据患者第h-1次就诊被诊断出的疾病作为节点,以就诊作为超边,构建疾病超图;

19、s30102、初始化疾病超图中的节点特征:以疾病超图作为输入,初始化疾病超图中节点的特征表示,得到就诊超图,并将输入就诊超图学习模块,具体如下,

20、首先将每一种疾病映射为可学习的嵌入向量,由于每种疾病都会与疾病超图中的节点一一对应,因此将每种疾病的嵌入表示作为疾病超图中对应节点的特征表示。

21、更优地,所述s302临床文本处理模块的具体步骤如下:

22、以预处理后的患者就诊记录作为输入,设计三步思维链提示方法完成三项子任务提取临床文本中与患者健康状况相关的重要信息:捕捉临床文本中与被诊断出的疾病相关的关键词和术语、从临床文本中提取影响患者健康状况的相关部分内容、根据提取的内容总结临床文本,得到总结后的临床文本,并将其输入临床文本编码模块;

23、s30201、提取关键词提示:为了捕捉临床文本中与疾病相关的关键词和术语,将句子“step 1:首先确定与被诊断出的疾病icd-9code相关的关键词和术语,其中可包括疾病名称、常见症状和相关医学术语(格式:关键词和术语:icd-9code)”作为第一步提示,调用大模型接口,得到临床文本中与被诊断出的疾病相关的关键本文档来自技高网...

【技术保护点】

1.基于临床文本增强的患者表示方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于临床文本增强的患者表示方法,其特征在于,所述S301就诊超图构建模块的具体步骤如下:

3.根据权利要求1所述的基于临床文本增强的患者表示方法,其特征在于,所述S303临床文本编码模块的具体步骤如下:

4.根据权利要求1所述的基于临床文本增强的患者表示方法,其特征在于,所述S305患者表示模块的具体步骤如下:

5.基于临床文本增强的序列疾病预测装置,其特征在于,该装置包括,

6.根据权利要求5所述的基于临床文本增强的序列疾病预测装置,其特征在于,所述预处理数据集单元的具体步骤如下:

7.根据权利要求5所述的基于临床文本增强的序列疾病预测装置,其特征在于,所述序列疾病预测模型构建单元包括就诊超图模块、临床文本处理模块、临床文本编码模块、就诊超图学习模块、患者表示模块、疾病预测模块,其中就诊超图模块、临床文本处理模块、临床文本编码模块、就诊超图学习模块、患者表示模块分别实现权利要求2-4所描述的基于临床文本增强的患者表示方法的模块;

8.根据权利要求5所述的基于临床文本增强的序列疾病预测装置,其特征在于,所述序列疾病预测模型训练单元的具体步骤如下:

9.一种储存介质,其中储存有多条指令,其特征在于,所述指令有处理器加载,执行权利要求1-8中所述的基于临床文本增强的患者表示及序列疾病预测装置的步骤。

10.一种电子设备,其特征在于,所述电子设备包括:

...

【技术特征摘要】

1.基于临床文本增强的患者表示方法,其特征在于,该方法包括以下步骤:

2.根据权利要求1所述的基于临床文本增强的患者表示方法,其特征在于,所述s301就诊超图构建模块的具体步骤如下:

3.根据权利要求1所述的基于临床文本增强的患者表示方法,其特征在于,所述s303临床文本编码模块的具体步骤如下:

4.根据权利要求1所述的基于临床文本增强的患者表示方法,其特征在于,所述s305患者表示模块的具体步骤如下:

5.基于临床文本增强的序列疾病预测装置,其特征在于,该装置包括,

6.根据权利要求5所述的基于临床文本增强的序列疾病预测装置,其特征在于,所述预处理数据集单元的具体步骤如下:

7.根据权利要求5所述的基于...

【专利技术属性】
技术研发人员:司加胜张鑫马国语管红娇鹿文鹏赵龙董祥军
申请(专利权)人:齐鲁工业大学山东省科学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1