当前位置: 首页 > 专利查询>武汉大学专利>正文

医疗大数据的后结构化处理方法、系统及存储介质技术方案

技术编号:28678655 阅读:40 留言:0更新日期:2021-06-02 02:56
本发明专利技术公开了一种医疗大数据的后结构化处理方法、系统及存储介质,该方法包括步骤:根据患者的临床表型解析结合医疗数据的特点构建数据项,数据项包括文本型,数值型/等级型,以及组合型;其中,组合型为文本型和数值型/等级型的逻辑组合;根据临床疾病的诊断逻辑形成数据集。本发明专利技术基于临床医疗大数据原有的非结构化、半结构化及结构化数据,将临床数据中的病史、体征、实验室检查、影像学检查等信息后结构化并构建成一条条有临床意义且便于利用的数据项,用于医疗大数据的疾病诊断条件及患病信息的直接提取与分析应用,提高临床大数据提取的效率和数据分析的正确率。

【技术实现步骤摘要】
医疗大数据的后结构化处理方法、系统及存储介质
本专利技术属于医疗大数据
,具体涉及一种医疗大数据的后结构化处理方法、系统及存储介质。
技术介绍
医疗大数据治理是目前医疗人工智能领域的一个热点。治理后的标准化数据对挖掘与应用提出更高的要求,在现有的技术方案中,很难将治理后的数据与应用充分结合,大大降低数据治理的价值。本专利技术提出了一种将临床特定疾病及相关指标数据直接提取的有效方法,实现基于患者特定疾病数据项的自动提取与计算,可直接用于后续的科学研究,大大提高临床数据应用效率和正确率。
技术实现思路
本专利技术的目的在于,提供一种医疗大数据的后结构化处理方法、系统及存储介质,将医疗大数据后结构化形成数据项及数据集,对医疗数据进行疾病患病情况的判断及相关指标提取并输出计算结果,得到特定疾病的患病情况结果。本专利技术提供一种医疗大数据的后结构化处理方法,包括以下步骤:根据患者的临床表型解析建立数据项,数据项包括文本型,数值型/等级型,以及组合型;其中,组合型为文本型和数值型/等级型的逻辑组合;根据临床疾病的诊断逻辑形成数据集,数据集为数据项的逻辑组合。进一步地,根据患者的临床表型解析建立数据项具体为:根据患者的病史、症状、体征和检查结果,通过关键字库匹配、诊断标准数值/等级判断和诊断思路综合逻辑判断形成数据项。进一步地,该方法还包括:根据文本型数据项的关键词库的关键词顺序,对临床数据进行匹配;若合法关键词匹配上,则输出第一符号,若否定关键词匹配上,则输出第二符号,其余匹配结果输出第三符号;利用数值型/等级型数据项对临床数据进行判断;若待临床数据为空,则输出第三符号,若临床数据符合数值型/等级型数据项,则输出第一符号,否则输出第二符号;判断组合型数据项,若组合型数据项中任一项文本型或数值型/等级型数据项输出结果为第一符号,则输出第一符号;若组合型数据项中的文本型或数值型/等级型数据项输出结果均为第三符号,则输出第三符号;其余则输出第二符号;根据数据项的输出结果得到数据集的输出结果。进一步地,关键词库包括标准术语、数据项名称、合法关键词、合法关键词-排除、否定关键词、否定关键词-排除、可疑关键词、可疑关键词-排除,以及合法、否定、可疑这三类关键词的调用顺序。本专利技术还提供一种用于实现上述医疗大数据的后结构化处理方法的医疗大数据的后结构化处理系统,包括:数据项建立模块,用于根据患者的临床表型解析建立数据项,数据项包括文本型,数值型/等级型,以及组合型;其中,组合型为文本型和数值型/等级型的逻辑组合;数据集形成模块,根据临床疾病的诊断逻辑形成数据集,数据集为数据项的逻辑组合;进一步地,该系统还包括:文本型数据项模块,用于根据文本型数据项的关键词库的关键词顺序,对临床数据进行匹配;若合法关键词匹配上,则输出第一符号,若否定关键词匹配上,则输出第二符号,其余匹配结果输出第三符号;数值型/等级型数据项模块,用于利用数值型/等级型数据项对临床数据进行判断;若临床数据为空,则输出第三符号,若临床数据符合数值型/等级型数据项,则输出第一符号,否则输出第二符号;组合型数据项模块,用于判断组合型数据项,若组合型数据项中任一项文本型或数值型/等级型数据项输出结果为第一符号,则输出第一符号;若组合型数据项中的文本型或数值型/等级型数据项输出结果均为第三符号,则输出第三符号;其余则输出第二符号;数据集模块,用于根据数据项的输出结果得到数据集的输出结果。本专利技术还提供一种计算机存储介质,其内存储有可被计算机处理器执行的计算机程序,该计算机程序执行如上所述的医疗大数据的后结构化处理方法。本专利技术的有益效果是:本专利技术的医疗大数据的后结构化处理方法、系统及存储介质,针对非结构化、半结构化及结构化的医疗大数据,将临床数据中的病史、体征、实验室检查、影像学检查等信息后结构化并形成一条条有临床意义且方便利用的数据项,用于医疗大数据的疾病患病信息及相关指标的直接提取与分析应用。在已有客观临床大数据的情况下,借助本专利技术可实现疾病患病情况及相关指标情况的直接提取与分析,为临床医护人员、患者及流行病学专业人员均提供更广度、更深度的数据应用维度。附图说明图1是本专利技术的医疗大数据的后结构化处理方法的流程图。图2是本专利技术的医疗大数据的后结构化处理系统的示意图。具体实施方式下面将结合附图对本专利技术作进一步的说明:本专利技术实施例的医疗大数据的后结构化处理方法,如图1所示,包括以下步骤:S1、根据患者的临床表型解析结合医疗数据的特点构建数据项,数据项包括文本型,数值型/等级型,以及组合型;其中,组合型为文本型和数值型/等级型的逻辑组合。首先,建立每一个数据样本的临床表型解析,并确定数据样本的疾病信息提取逻辑规则,即对该样本的病史、症状、体征、实验室检查、影像学检查等各种数据通过关键字库匹配、诊断标准数值判断和诊断思路综合逻辑判断形成数据项。其中,数据样本是一个患者所有的指标数据,临床表型解析指对这个样本的所有临床指标进行分析,构建疾病提取模型,例如:根据一个人的收缩压、舒张压、临床症状、既往史、用药史可以判断这个样本是否有高血压。数据项,分为三种类型:文本型,数值型/等级型,组合型。其中,文本型数据项,如既往史发现高血压,通过挖掘既往史的文本,判断既往史的文本是否包含“高血压”这几个字,对文本型数据项进行文本数据的特定提取与分析。数值型数据项,如“舒张压≥90mmHg”,通过对医疗临床数据的舒张压的数值进行提取及判断,实现对数值型临床数据的特定提取与分析;等级型数据项,如“乙型肝炎表面抗体阳性”,通过判断乙型肝炎表面抗体的阴阳等级,输出等级型数据项的判断结果,实现对等级型临床数据的特定提取与分析。组合型数据项,主要是根据文本型数据项、数值型/等级型数据项等多个数据项通过一定的逻辑进行组合判断。如组合型数据项“本次体检发现高血压”的诊断是基于两个数据项“舒张压≥90mmHg”及“收缩压≥140mmHg”共同判断:如果医疗数据中的舒张压和收缩压数值满足这两个数据项中的任意一个,则组合型数据项“本次体检发现高血压”的结果判断为“1”。两个数据项均不满足,则数据项“本次体检发现高血压”结果为“0”。剩余数据的结果输出为“空”。S2、根据临床疾病的诊断逻辑形成数据集,数据集为数据项的逻辑组合。数据集是一种特殊形式的数据项,是由文本型,数值型/等级型,组合型数据项进行逻辑组合形成的。数据集和数据项的区别在于临床意义不同,数据集是疾病。如数据集“高血压”是根据数据项“既往史发现高血压”,“服用降压药史”,舒张压≥90mmHg”,“收缩压≥140mmHg”共同判断:如果“既往史发现高血压”,“服用降压药史”,舒张压≥90mmHg”,“收缩压≥140mmHg”这四个数据项中的任意一个满意,则组合型数据项“本次体检发现高血压”的结果判断为“1”。四个数据项均不满本文档来自技高网...

【技术保护点】
1.一种医疗大数据的后结构化处理方法,其特征在于,包括以下步骤:/n根据患者的临床表型解析结合医疗数据的特点构建数据项,数据项包括文本型,数值型/等级型,以及组合型;其中,组合型为文本型和数值型/等级型的逻辑组合;/n根据临床疾病的诊断逻辑形成数据集,数据集为数据项的逻辑组合。/n

【技术特征摘要】
1.一种医疗大数据的后结构化处理方法,其特征在于,包括以下步骤:
根据患者的临床表型解析结合医疗数据的特点构建数据项,数据项包括文本型,数值型/等级型,以及组合型;其中,组合型为文本型和数值型/等级型的逻辑组合;
根据临床疾病的诊断逻辑形成数据集,数据集为数据项的逻辑组合。


2.根据权利要求1所述的医疗大数据的后结构化处理方法,其特征在于,根据患者的临床表型解析建立数据项具体为:根据患者的病史、症状、体征和检查结果,通过关键字库匹配、诊断标准数值/等级判断和诊断思路综合逻辑判断形成数据项。


3.根据权利要求1或2所述的医疗大数据的后结构化处理方法,其特征在于,该方法还包括:
根据文本型数据项的关键词库的关键词顺序,对临床数据进行匹配;若合法关键词匹配上,则输出第一符号,若否定关键词匹配上,则输出第二符号,其余匹配结果输出第三符号;
利用数值型/等级型数据项对临床数据进行判断;若待临床数据为空,则输出第三符号,若临床数据符合数值型/等级型数据项,则输出第一符号,否则输出第二符号;
判断组合型数据项,若组合型数据项中任一项文本型或数值型/等级型数据项输出结果为第一符号,则输出第一符号;若组合型数据项中的文本型或数值型/等级型数据项输出结果均为第三符号,则输出第三符号;其余则输出第二符号;
根据数据项的输出结果得到数据集的输出结果。


4.根据权利要求3所述的医疗大数据的后结构化处理方法,其特征在于,关键词库包括标准术语、数据项名称、合法关键词、合法关键词-排除、否定关键词、否定关键词...

【专利技术属性】
技术研发人员:李红良朱丽华张晓晶
申请(专利权)人:武汉大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1