System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于临床量表和因果发现的疾病风险评估方法及系统技术方案_技高网

一种基于临床量表和因果发现的疾病风险评估方法及系统技术方案

技术编号:40673311 阅读:16 留言:0更新日期:2024-03-18 19:10
本发明专利技术公开了一种基于临床量表和因果发现的疾病风险评估方法及系统,应用于医学评估和医学信息处理技术领域,得到初始结构化数据集;构建端到端的临床量表信息抽取模型,从临床文本中抽取出目标临床量表信息;生成因果图;得到待评估个体的风险量化值。本发明专利技术能够在统一模型框架下同时识别临床量表相关实体及其关系并进行疾病风险评估。避免了基于管道方法在提取量表中存在的错误传播问题,并且充分考虑了实体识别与关系抽取两个子任务之间的语义关联,提升了临床量表信息提取的准确性。同时基于因果学习的方法能够从全局角度提取特征组合,从而实现比常用的特征选择方式更好的风险评估模型的稳定性。

【技术实现步骤摘要】

本专利技术涉及医学评估和医学信息处理,更具体的说是涉及一种基于临床量表和因果发现的疾病风险评估方法及系统


技术介绍

1、对于起病急、异质性较大的疾病,通常应用临床量表对疾病的进展和预后进行快速评估,以便于采取针对性的实施方案。临床量表是按照特定格式组织的一系列“检查项-评分”,在临床实践和临床科研中发挥着重要作用。然而,当前真实诊疗环境中产生的临床量表信息通常以住院病案首页、病程记录、出院小结等形式存储于电子病历中。其自由文本形式缺乏标准的语言描述,使得目前仍然没有较好的自动化方法获取这些临床量表信息。这一方面限制了临床量表在真实世界研究中的应用,进而阻碍了新疗法、药物、器械等的评估和临床应用;另一方面也使得临床量表自动化提取难以实现。目前常用的提取方式主要有三类,依赖专家手工提取虽然准确率高,但存在提取成本高、耗时长、无法满足多样化的真实世界研究需求等问题;基于正则表达式和规则的信息抽取方法缺乏泛化性;基于管道的方法存在错误传播问题,无法实现临床量表信息的准确提取与高效利用。

2、目前针对疾病的风险评估方法除了评分,还可以应用机器学习来预测疾病的并发症以及预后,从而采用针对性的治疗方案。但当前机器学习主要以预测数据的相关关系为主,而相关关系并不是稳定的,这种不稳定直接导致了模型的鲁棒性和泛化性不佳,当训练集和测试集的数据存在偏差,模型的预测效果就会变得不可信,这类问题可以被归结为分布外泛化(out of distribution,ood)问题。基于观测数据的因果发现方法能够进一步提高预测水平,同时还能减少模型的ood问题,从而提升不同中心的评分稳定性。


技术实现思路

1、有鉴于此,本专利技术提供了一种基于临床量表和因果发现的疾病风险评估方法及系统,以解决
技术介绍
中的问题。

2、为了实现上述目的,本专利技术提供如下技术方案:

3、一方面,本专利技术公开了一种基于临床量表和因果发现的疾病风险评估方法,具体步骤如下:

4、选取特定疾病相关的电子病历数据集,并选择备选特征,处理得到初始结构化数据集;

5、从电子病历数据集中提取包含目标量表的数据样本集,并对所述数据样本集进行划分,用于构建端到端的临床量表信息抽取模型,从临床文本中抽取出目标临床量表信息;

6、根据所述初始结构化数据集和所述目标临床量表信息检验因果假设条件,针对任务特点选择合适的因果发现模型,生成因果图;

7、融合因果图信息进行疾病风险预测模型训练,验证模型效果,将待评估个体的信息输入到风险预测模型,得到待评估个体的风险量化值。

8、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估方法中,得到初始结构化数据集具体步骤如下:

9、确定进行分析的疾病或疾病群,选择与特定疾病相关的电子病历数据集;

10、确定预后事件,并筛选适合后续分析的初始电子病历数据集;

11、根据领域知识和已有研究,选择备选特征,加工处理得到初始结构化数据集。

12、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估方法中,构建端到端的临床量表信息抽取模型具体步骤包括:

13、使用神经网络模型作为框架,包括嵌入层、编码层和解码层;嵌入层用于将临床文本中的词转换为词嵌入向量;编码层用于获取上下文语义信息;解码层以输出概率最高的标签序列;通过进行端到端的训练,从临床文本中抽取出目标临床量表的信息。

14、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估方法中,生成因果图的具体步骤如下:

15、检验因果假设条件,所述因果假设条件包括因果关系的时间顺序、共变性和排除其他解释;

16、根据任务的特点选择合适的因果发现模型;所述因果发现模型包含基于统计方法的因果发现模型和基于深度学习的因果发现模型,选择合适的模型需要考虑数据的特点、因果关系的复杂程度以及分析的目标;

17、选择合适的因果发现模型后,在临床电子病历数据中对其进行训练、参数估计和优化;通过训练因果发现模型,从临床电子病历数据中生成因果图。

18、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估方法中,得到待评估个体的风险量化值具体步骤如下:

19、将因果图作为特征筛选方式,选择结局变量的马尔科夫边界或者直接父节点作为特征集合进行模型训练和评估;或利用因果图信息与多层感知机等分类融合对疾病预后事件进行预测,并根据预测结果进行风险评估。

20、另一方面,本专利技术公开了一种基于临床量表和因果发现的疾病风险评估系统,包括:

21、第一获取模块,选取特定疾病相关的电子病历数据集,并选择备选特征,处理得到初始结构化数据集;

22、第二解析模块,从电子病历数据集中提取包含目标量表的数据样本集,并对所述数据样本集进行划分,用于构建端到端的临床量表信息抽取模型,从临床文本中抽取出目标临床量表信息;

23、因果图生成模块,根据所述初始结构化数据集和所述目标临床量表信息检验因果假设条件,针对任务特点选择合适的因果发现模型,生成因果图;

24、评估模块,融合因果图信息进行疾病风险预测模型训练,验证模型效果,将待评估个体的信息输入到风险预测模型,得到待评估个体的风险量化值。

25、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估系统中,第一获取模块包括:

26、第一确定单元,确定进行分析的疾病或疾病群,选择与特定疾病相关的电子病历数据集;

27、第二确定单元,确定预后事件,并筛选适合后续分析的初始电子病历数据集;

28、预处理单元,根据领域知识和已有研究,选择备选特征,加工处理得到初始结构化数据集。

29、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估系统中,第二解析模块包括:拆解单元和模型构建单元;

30、拆解单元,从电子病历数据集中拆解出包含目标量表的数据样本集;

31、所述模型构建单元,使用神经网络模型作为框架,包括嵌入层、编码层和解码层;嵌入层用于将临床文本中的词转换为词嵌入向量;编码层用于获取上下文语义信息;解码层以输出概率最高的标签序列;通过进行端到端的训练,从临床文本中抽取出目标临床量表的信息。

32、优选的,在上述的一种基于临床量表和因果发现的疾病风险评估系统中,因果图生成模块包括:

33、检验单元,检验因果假设条件,所述因果假设条件包括因果关系的时间顺序、共变性和排除其他解释;

34、选择单元,根据任务的特点选择合适的因果发现模型;所述因果发现模型包含基于统计方法的因果发现模型和基于深度学习的因果发现模型,选择合适的模型需要考虑数据的特点、因果关系的复杂程度以及分析的目标;

35、训练单元,选择合适的因果发现模型后,在临床电子病历数据中对其进行训练、参数估计和优化;通过训练因果发现模型,从临床电子病本文档来自技高网...

【技术保护点】

1.一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,具体步骤如下:

2.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,得到初始结构化数据集具体步骤如下:

3.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,构建端到端的临床量表信息抽取模型具体步骤包括:

4.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,生成因果图的具体步骤如下:

5.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,得到待评估个体的风险量化值具体步骤如下:

6.一种基于临床量表和因果发现的疾病风险评估系统,其特征在于,包括:

7.根据权利要求6所述的一种基于临床量表和因果发现的疾病风险评估系统,其特征在于,第一获取模块包括:

8.根据权利要求6所述的一种基于临床量表和因果发现的疾病风险评估系统,其特征在于,第二解析模块包括:拆解单元和模型构建单元;

9.根据权利要求6所述的一种基于临床量表和因果发现的疾病风险评估系统,其特征在于,因果图生成模块包括:

10.根据权利要求6所述的一种基于临床量表和因果发现的疾病风险评估系统,其特征在于,评估模块包括:

...

【技术特征摘要】

1.一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,具体步骤如下:

2.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,得到初始结构化数据集具体步骤如下:

3.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,构建端到端的临床量表信息抽取模型具体步骤包括:

4.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,生成因果图的具体步骤如下:

5.根据权利要求1所述的一种基于临床量表和因果发现的疾病风险评估方法,其特征在于,得到待评估个体的风...

【专利技术属性】
技术研发人员:杨林李姣王嘉阳王梓阳黄晓硕
申请(专利权)人:中国医学科学院医学信息研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1