【技术实现步骤摘要】
腹痛特征提取方法、装置、电子设备及存储介质
[0001]本申请涉及医疗辅助
,尤其涉及一种腹痛特征提取方法、装置、电子设备及存储介质。
技术介绍
[0002]急性腹痛是一种常见的临床疾病。然而急性腹痛病症复杂,可能引起急性腹痛的病因有95种之多,而急性腹痛患者的表现也错综复杂,诊断不准确或者不及时不仅会浪费医疗资源而且更有可能导致患者病情延误,这些问题给医务人员带来了繁重的工作和高水平的要求。然而,由于医生的培养需要漫长的周期,如何能够高质量、快速的对急性腹痛进行诊断成了一个迫切的需求。
[0003]医院病历数据包含了患者的现病史、既往史、家族史、体格检查,以及患者从入院、治疗直至出院期间的病程数据,这些数据有着丰富的疾病、检查、诊断、治疗等医学相关信息,这些信息对于急性腹痛的诊治起着关键的作用。然而,一方面由于病历数据往往并非是完全的键值对这种结构化形式,很多信息包含在自由书写的病历文本中,如现病史、病史小结,使得直接提取这些特征变得非常困难,有些特征需要通过语义理解的方式提取,如“无法排气排便”、“食欲差”等,当前常用的语义理解方式为直接对病历文本进行理解,但该方式的准确性较低,提取效果不佳;另一方面,不同医院的病历格式各异,使得从病历中获取信息的难度也较大。
[0004]因此,当前在从病历中提取腹痛特征过程中存在提取困难且提取准确性不高的技术问题,需要改进。
技术实现思路
[0005]本申请实施例提供一种腹痛特征提取方法、装置、电子设备及存储介质,用以缓解当前在从病历中提取 ...
【技术保护点】
【技术特征摘要】
1.一种腹痛特征提取方法,其特征在于,包括:获取目标对象的原始腹痛病历,对所述原始腹痛病历进行结构化处理,得到所述目标对象的结构化腹痛病历;获取腹痛疾病类型数据,根据所述腹痛疾病类型数据得到各类腹痛疾病的参考腹痛特征,根据各参考腹痛特征的属性对所述参考腹痛特征进行分类,得到第一类参考腹痛特征、第二类参考腹痛特征、第三类参考腹痛特征和第四类参考腹痛特征;基于所述第一参考腹痛特征对所述结构化腹痛病历进行检索和判断,根据检索结果和判断结果,得到第一类目标腹痛特征;基于所述第二类参考腹痛特征,得到第二类目标腹痛特征关键词的第一正则表达式,基于所述第一正则表达式对所述结构化腹痛病历进行匹配,得到第二类目标腹痛特征关键词,从所述结构化腹痛病历中提取所述第二类目标腹痛特征关键词之前或之后的目标否定描述词、以及所述第二类目标腹痛特征关键词和所述目标否定描述词之间的目标中间文本,组合每一所述第二类目标腹痛特征关键词、对应的目标否定描述词以及对应的目标中间文本,得到第一候选组合数据;根据每一所述第一候选组合数据中目标否定描述词和第二类目标腹痛特征关键词的位置关系、目标中间文本与预设符号集的匹配结果、以及目标中间文本与预设文本集的匹配结果,得到各所述第二类目标腹痛特征关键词的第一否定关系抽取结果;调用训练后的否定关系抽取模型对每一所述第一候选组合数据进行处理,得到各所述第二类目标腹痛特征关键词的第二否定关系抽取结果;根据所述第一否定关系抽取结果和所述第二否定关系抽取结果,得到第二类目标腹痛特征;基于所述第三类参考腹痛特征,得到第三类目标腹痛特征关键词的第二正则表达式、以及第三类目标腹痛特征值的第三正则表达式,基于所述第二正则表达式对所述结构化腹痛病历进行匹配,得到第三类目标腹痛特征关键词,基于所述第三正则表达式对所述第三类目标腹痛特征值进行抽取,根据抽取结果,得到第三类目标腹痛特征;基于所述第四类参考腹痛特征,从所述结构化腹痛病历中获取候选腹痛特征描述文本,并生成各候选腹痛特征描述文本的候选特征名和候选特征类型名,组合每一候选腹痛特征描述文本与其对应的候选特征名和候选特征类型名组,得到第二候选组合数据,所述候选特征类型名组包括三个候选特征类型名,调用训练后的特征标记模型对每一所述第二候选组合数据进行处理,得到所述候选特征类型名组中目标特征类型名的标记结果,根据所述标记结果,得到第四类目标腹痛特征;根据所述第一类目标腹痛特征、所述第二类目标腹痛特征、所述第三类目标腹痛特征和所述第四类目标腹痛特征,得到所述目标对象的腹痛特征。2.根据权利要求1所述的腹痛特征提取方法,其特征在于,获取目标对象的原始腹痛病历,对所述原始腹痛病历进行结构化处理,得到所述目标对象的结构化腹痛病历的步骤,包括:从参考病历集中获取多个第一参考结构关键词、以及各第一参考结构关键词之间的参考层级结构关系;获取目标对象的原始腹痛病历,根据所述第一参考结构关键词,从所述原始腹痛病历中得到多个第一候选结构关键词,根据所述参考层级结构关系,确定各第一候选结构关键词之间的节点关系;
遍历所有第一候选结构关键词,根据第i个第一候选结构关键词后的候选符号与第一符号集和第二符号集的匹配结果、所述第i个第一候选结构关键词的相邻第一候选结构关键词的确认状态、以及所述相邻第一候选结构关键词与所述第i个第一候选结构关键词之间的节点关系,确定所述第i个第一候选结构关键词的确认状态,i为正整数;根据各第一候选结构关键词的确认状态,得到多个第一目标结构关键词,并从所述原始腹痛病历中获取各第一目标结构关键词的值;根据各第一目标结构关键词之间的节点关系,确定各第一目标结构关键词之间的目标层级结构关系,根据各第一目标结构关键词和值、以及所述目标层级结构关系,得到所述目标对象的结构化腹痛病历。3.根据权利要求1所述的腹痛特征提取方法,其特征在于,获取目标对象的原始腹痛病历,对所述原始腹痛病历进行结构化处理,得到所述目标对象的结构化腹痛病历的步骤,包括:获取预设病历模板,所述预设病历模板包括M个第二参考结构关键词和各第二参考结构关键词的值属性信息,根据各第二参考结构关键词的文本内容和文本长度,得到各第二参考结构关键词的参考正则表达式,M为正整数;获取目标对象的原始腹痛病历,遍历所有第二参考结构关键词,基于第j个第二参考结构关键词的第j参考正则表达式对所述原始腹痛病历进行匹配,得到第j组第二候选结构关键词,所述第i组第二候选结构关键词包括至少一个第二候选结构关键词,j为正整数;遍历所有第二候选结构关键词,根据所述第j组候选结构关键词中各第二候选结构关键词的文本长度和第j个第二参考结构关键词的文本长度,得到所述第j组候选结构关键词中各第二候选结构关键词的局部匹配分数;从各组第二候选结构关键词中分别取一个第二候选结构关键词,将M个第二候选结构关键词的局部匹配分数相加得到全局匹配分数,基于全局最优算法得到最大全局匹配分数,并将所述最大全局匹配分数对应的取词方案中M个第二候选结构关键词确定为第二目标结构关键词;基于各第二参考结构关键词的值属性信息,对各第二目标结构关键词的值进行抽取,根据抽取结果得到所述目标对象的结构化腹痛病历。4.根据权利要求3所述的腹痛特征提取方法,其特征在于,基于各第二参考结构关键词的值属性信息,对各第二目标结构关键词的值进行抽取的步骤,包括:遍历所有第二参考结构关键词,在第j个第二参考结构关键词的值属性信息包括预设格式或自定义格式时,基于所述预设格式或自定义格式正则表达式对第j个第二目标结构关键词的值进行抽取,得到第j个第二目标结构关键词的值;在第j个第二参考结构关键词的值属性信息包括预设病历子模板时,获取所述预设病历子模板,所述预设病历子模板包括N...
【专利技术属性】
技术研发人员:彭翔,胡珊,
申请(专利权)人:武汉楚精灵医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。