当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于任务分解策略的发热待查辅助鉴别诊断系统技术方案

技术编号:31157653 阅读:12 留言:0更新日期:2021-12-04 09:55
本发明专利技术公开了一种基于任务分解策略的发热待查辅助鉴别诊断系统,首次全面且系统地构建了发热待查潜在病因类别层次结构,基于类别层次结构实现了针对发热待查潜在病因进行辅助鉴别诊断的层次分类模型,并能够模拟临床医生的推理逻辑,逐层给出鉴别诊断意见,不仅鉴别范围更全面、系统,同时具有更高的鉴别准确度和更好的临床可解释性,由上向下的逐层推理模式也更加符合临床医生的临床实践习惯;本发明专利技术所利用的临床数据都是患者就诊早期极易获取的早期临床表现数据,因此在患者早期就诊阶段就能够基于有限信息给出极具临床价值和可信度的鉴别诊断意见;本发明专利技术为发热待查潜在病因的鉴别诊断提供了全面、系统、层次化的解决策略。策略。策略。

【技术实现步骤摘要】
一种基于任务分解策略的发热待查辅助鉴别诊断系统


[0001]本专利技术属于医疗健康信息
,尤其涉及一种基于任务分解策略的发热待查辅助鉴别诊断系统。

技术介绍

[0002]作为多数临床问题的最常见症状之一,发热不仅是约30%儿童就诊的首要原因,同时在ICU护理的急重症成人患者中发生率也高达75%。尽管随着诊疗技术的进步,大部分发热待查患者可以得到相应的诊断,但在国际范围内仍有约7%

53%的发热待查患者即使通过全面系统的检查也未能得到明确诊断。同时发热待查患者的预后与潜在病因高度相关,部分病程发展较快的患者,若前期得不到准确诊断与恰当治疗,可快速出现危及生命的并发症,因此确诊越晚其预后越差。除此之外,在没有倾向性诊断基础上进行经验性抗感染治疗不仅缺乏循证医学依据,高度依赖临床医生经验,同时也易导致致病菌耐药性的提升以及非靶向性药物和多次转诊等医疗资源的浪费。加之发热待查潜在病因可达200多种,且其临床表现多样、复合度高,因此对发热待查潜在病因的早期鉴别诊断仍然是国内外临床医生所面临的重要挑战,尤其是在医疗资源条件相对落后的地区。
[0003]由于发热待查潜在病因复杂,且不同地区、不同时期和不同年龄的患者在不同配置的医疗资源条件下其病因构成比例都会有所差异,因此直接通过传统机器学习手段进行潜在病因多分类,往往存在类别间样本不均衡、分类问题复杂度高的固有缺陷,难以确保分类精度。
[0004]现有技术方案[申请公布号:CN112768057A,专利技术名称:鉴别儿童发热待查病因的系统]提出的发热待查潜在病因鉴别方案只针对儿童群体,因此其潜在病因范围相对较小,系统鉴别难度低。除此之外,该方案描述的鉴别系统只利用了年龄、钠离子、氯离子、乳酸脱氢酶、球蛋白、红细胞压积、C反应蛋白及白细胞酯酶8项指标对发热待查患者的潜在病因是否为感染性进行判断,因此发热待查潜在病因鉴别诊断内容不完整,且8项指标所能表示的特征空间较小,临床适应性较差。
[0005]现有技术方案[申请公布号:CN107785075A,专利技术名称:基于文本病历的小儿发热疾病深度学习辅助诊断系统]描述的发热疾病深度学习辅助诊断方案同样只针对小儿群体,且该系统直接对30种常见小儿发热疾病进行分类,而非针对发热待查潜在病因。此外,该方案主要是强调对临床文本病历数据的利用,通过自然语言处理技术对其进行文本特征提取以作为小儿发热鉴别诊断的特征空间,不涉及其他时序、结构化数据内容。
[0006]目前针对发热待查潜在病因进行辅助鉴别诊断的技术方案相对缺乏,该研究
仍处于探索阶段。现有技术方案存在如下缺陷:1.现有技术方案均只针对儿童群体的发热相关疾病进行鉴别诊断,儿童群体的发热相关疾病类型与范围相较于整体发热待查潜在病因的类型和范围仍有很大差别,且临床实际场景中发热待查群体主要是以成年人为主。
[0007]2.现有技术方案均只局限于感染性疾病与非感染性疾病的鉴别或只局限于易区
分的小部分疾病,发热待查潜在病因的鉴别诊断覆盖范围不完整,因此临床实际适用性和可扩展性差。
[0008]3.现有技术方案只是对小部分发热相关疾病进行分类,所依赖的临床数据并非患者早期就诊的非特异性数据,而对发热待查患者进行辅助鉴别诊断最具有临床价值的便是在患者就诊早期,在临床医生基于有限临床表现数据难以得出倾向性诊断的情况下给予临床医生以辅助鉴别诊断意见。
[0009]4.现有技术方案均只涉及患者几项临床化验指标或单模态临床数据,并未对多模态的数据融合给出详细解决方案,因此所能挖掘的特征关联与所能表达的信息空间有限,而对发热待查患者做早期辅助鉴别诊断亟需对有限数据进行最大程度的利用。
[0010]5.现有技术方案针对发热待查潜在病因的鉴别诊断主要依赖于机器学习模型直接进行多分类,因此难以解决因发热待查潜在病因复杂多样导致的样本分布不均衡问题,不仅难以保证多分类的分类精度,且复杂的多分类任务缺少临床可解释性,难以在临床实际应用场景条件下被医生所接受。
[0011]6.发热患者入院就诊往往存在多次多科室门诊就诊或住院就诊,相关临床数据主要以就诊主索引进行关联组织,现有技术方案均缺少针对多次就诊的分散临床数据进行规整的有效机制,无法对患者分散的临床数据进行分割与整合,造成临床业务数据与辅助鉴别系统所需数据之间的数据鸿沟。

技术实现思路

[0012]本专利技术针对现有技术方案的不足,提供一种基于任务分解策略的发热待查辅助鉴别诊断系统,为发热待查潜在病因的鉴别诊断提供了全面、系统、层次化的解决策略。
[0013]本专利技术的目的是通过以下技术方案实现的:一种基于任务分解策略的发热待查辅助鉴别诊断系统,该系统包括以下模块:(1)数据获取模块:实现发热待查辅助鉴别诊断系统与异构源数据库的连接;通过交互界面配置在异构源数据库内的目标临床信息的数据范围,以及患者唯一标识、就诊唯一标识,并完成对目标数据的扫描以及校验性数据的统计,建立目标数据采集的完整数据通路;(2)数据规整模块:建立数据规整策略,通过设定发热待查诊断锚点和锚点前后就诊时间差,确定不同就诊周期;基于数据规整策略对临床业务当中因患者多次门诊就诊与住院就诊产生的不定间隔的业务数据进行重新分割与整合,形成单个患者因单次发热就诊产生的最小数据分析单元;在最小数据分析单元时间范围内提取最早的就诊病历记录数据;(3)多模态数据预处理模块:针对指定类型的病历文本数据,利用正则表达式技术根据不同类型病历文本的结构特点分别采取位置导向模式和关键词导向模式对病历文本进行目标信息结构化提取;对不同采样频率、不同长度以及存在缺失值的多变量时序数据,进行时间窗口对齐与归一化处理;针对结构化数据,完成对分类变量与数值变量的异常值处理、缺失值填充、标准编码以及标准化;(4)发热待查潜在病因层次鉴别模块,包括:结合医学文献与临床指南,基于任务分解策略构建发热待查潜在病因类别层次结
构,将复杂且样本分布不均衡的多分类问题转化为包含多个二分类和三分类任务的层次分类问题;建立发热待查潜在病因层次分类模型,将模型分类输出空间定义在发热待查潜在病因类别层次结构之上;在模型训练阶段,采取siblings策略对阳性与阴性训练样本进行划分,基于划分的多个训练样本集分别训练多个基分类器;在模型实际应用阶段,采取Top

Down算法对多个基分类器在上下层级间的分类结果进行后处理,修正单个基分类器的局部概率,给出符合发热待查潜在病因类别层次结构的一致概率,得到发热待查患者潜在病因的层次类别分类结果,基于层次类别分类结果给出层次化鉴别诊断意见。
[0014]进一步地,所述系统还包括结果展示模块,所述结果展示模块用于对发热待查潜在病因层次分类模型涉及的临床表现数据以就诊时间线的方式进行可视化展示,并对发热待查潜在病因层次鉴别模块得到的层次类别分类结果及层次化鉴别诊断意见进行可视化展示。
[0015]进一步地,所述数据获取模块包含数据库连接管理单元和目标数据自定义单元;所述数据库连接管理单元包括本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于任务分解策略的发热待查辅助鉴别诊断系统,其特征在于,包括以下模块:(1)数据获取模块:实现发热待查辅助鉴别诊断系统与异构源数据库的连接;通过交互界面配置在异构源数据库内的目标临床信息的数据范围,以及患者唯一标识、就诊唯一标识,并完成对目标数据的扫描以及校验性数据的统计,建立目标数据采集的完整数据通路;(2)数据规整模块:建立数据规整策略,通过设定发热待查诊断锚点和锚点前后就诊时间差,确定不同就诊周期;基于数据规整策略对临床业务当中因患者多次门诊就诊与住院就诊产生的不定间隔的业务数据进行重新分割与整合,形成单个患者因单次发热就诊产生的最小数据分析单元;在最小数据分析单元时间范围内提取最早的就诊病历记录数据;(3)多模态数据预处理模块:针对指定类型的病历文本数据,利用正则表达式技术根据不同类型病历文本的结构特点分别采取位置导向模式和关键词导向模式对病历文本进行目标信息结构化提取;对不同采样频率、不同长度以及存在缺失值的多变量时序数据,进行时间窗口对齐与归一化处理;针对结构化数据,完成对分类变量与数值变量的异常值处理、缺失值填充、标准编码以及标准化;(4)发热待查潜在病因层次鉴别模块,包括:基于任务分解策略构建发热待查潜在病因类别层次结构,将复杂且样本分布不均衡的多分类问题转化为包含多个二分类和三分类任务的层次分类问题;建立发热待查潜在病因层次分类模型,将模型分类输出空间定义在发热待查潜在病因类别层次结构之上;在模型训练阶段,采取siblings策略对阳性与阴性训练样本进行划分,基于划分的多个训练样本集分别训练多个基分类器;在模型实际应用阶段,采取Top

Down算法对多个基分类器在上下层级间的分类结果进行后处理,修正单个基分类器的局部概率,给出符合发热待查潜在病因类别层次结构的一致概率,得到发热待查患者潜在病因的层次类别分类结果,基于层次类别分类结果给出层次化鉴别诊断意见。2.根据权利要求1所述的一种基于任务分解策略的发热待查辅助鉴别诊断系统,其特征在于,所述系统还包括结果展示模块,所述结果展示模块用于对发热待查潜在病因层次分类模型涉及的临床表现数据以就诊时间线的方式进行可视化展示,并对发热待查潜在病因层次鉴别模块得到的层次类别分类结果及层次化鉴别诊断意见进行可视化展示。3.根据权利要求1所述的一种基于任务分解策略的发热待查辅助鉴别诊断系统,其特征在于,所述数据获取模块包含数据库连接管理单元和目标数据自定义单元;所述数据库连接管理单元包括:通过java编程语言的类及接口编写多个JDBC模块,建立与异构数据库之间的数据通路,实现与源数据库之间的SQL命令交互以及对源数据库返回数据的存储;所述目标数据自定义单元包括:针对发热待查潜在病因层次分类模型所需的目标临床信息划定数据范围,通过交互界面配置数据范围、患者唯一标识和就诊唯一标识,完成目标数据到缓存数据库的数据传输,确定完整数据通路。4.根据权利要求1所述的一种基于任务分解策略的发热待查辅助鉴别诊断系统,其特征在于,所述数据规整模块中,以患者最早被诊断为发热待查的电子病历记录事件为发热待查诊断锚点,往前纳入7个自然日以内的就诊病历记录,往后纳入下次就诊开始时间与本次就诊结束时间差小于等于24小时的所有就诊病历记录,作为一次就诊周期;下次就诊开始时间距离本次就诊结束时间大于24小时的就诊病历记录归为下一个就诊周期,以此形成
单个患者因单次发热就诊产生的最小数据分析单元。5.根据权利要求1所述的一种基于任务分解策略的发热待查辅助鉴别诊断系统,其特征在于,所述多模态数据预处理模块包括文本数据预处理单元、时序数据预处理单元和结构化数据预处理单元;所述文本数据预处理单元包括:针对既往史、个人史、家族史与婚育史这四类病历文本数据,采取位置导向模式分别编写正则表达式语句进行目标信息结构化提取;基于主诉与现病史这两类病历文本数据,采取关键词导向模式,利用词典分词技术构建目标症状词典及词典匹配规则;所述目标症状词典包括位置信息不敏感的全身症状词典、位置信息敏感的症状词典以及身体部位词典,所述词典匹配采取双向最长匹配算法对症状名称、持续时间、频次、身体部位信息进行结构化提取;所述时序数据预处理单元包括:对多变量时序数据进行时间窗口对齐,取每次就诊固定时间内的数据作为患者早期临床表现数据;每行数据对应于每位患者的一项时序变量数据序列,依据每一项时序变量数据采样频率以及采样时间跨度的长短分布,明确输入数据时间窗口以及列与列之间的时间间隔,实现对同一患者同一次就诊内...

【专利技术属性】
技术研发人员:李劲松王执晓田雨周天舒
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1