当前位置: 首页 > 专利查询>清华大学专利>正文

诊断多写检测方法、装置、电子设备和存储介质制造方法及图纸

技术编号:37672752 阅读:33 留言:0更新日期:2023-05-26 04:35
本发明专利技术提供一种诊断多写检测方法、装置、电子设备和存储介质,其中方法包括:获取待检测的诊断疾病名;检测诊断疾病名所对应的病历文本中包含的疾病名,并与诊断疾病名相关的疾病名在病历文本中所处的片段,以及从病历文本中检索得到的与诊断疾病名相关的片段,确定诊断疾病名的相关片段集合;基于诊断疾病名的相关片段集合中的各片段分别与诊断疾病名之间的相关度,进行诊断多写检测。本发明专利技术提供的方法、装置、电子设备和存储介质,通过确定诊断疾病名的相关片段集合,确保病历文本中相关片段的全面性。随后基于诊断疾病名的相关片段集合中的各片段分别与诊断疾病名之间的相关度,进行诊断多写检测,实现了不遗漏且不误判的诊断多写检测。多写检测。多写检测。

【技术实现步骤摘要】
诊断多写检测方法、装置、电子设备和存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种诊断多写检测方法、装置、电子设备和存储介质。

技术介绍

[0002]当前针对诊断多写检测的问题,主要是通过知识库辅助检测,针对诊断列表中的每个诊断疾病名,从整个病历文本中查找疾病诊断名的相关要素,由此来判断是否出现诊断多写。或者,根据疾病预测方法进行检测,通过输入病历文本,使用深度学习方法对病历文本所对应的疾病进行端到端预测,来判断是否出现诊断多写。
[0003]但是通过知识库辅助检测会出现检测方式不灵活,导致遗漏或者误判诊断多写的情况;而根据疾病预测的方法进行诊断多写检测,只能预测到主要诊断,难以预测出非主要诊断,因此即便某个诊断疾病名未在预测结果中,也往往很难确定是否存在诊断多写。

技术实现思路

[0004]本专利技术提供一种诊断多写检测方法、装置、电子设备和存储介质,用以解决现有技术中进行诊断多写检测时可能会出现检测方式不灵活,导致遗漏或者误判诊断多写的情况,或者,只能针对主要诊断进行判断是否多写,对大概率出现诊断多写的非主要诊断不能进行精准的判断是否存在诊断多写的缺陷。
[0005]本专利技术提供一种诊断多写检测方法,包括:
[0006]获取待检测的诊断疾病名;
[0007]检测所述诊断疾病名所对应的病历文本中包含的疾病名,并基于与所述诊断疾病名相关的疾病名在所述病历文本中所处的片段,以及从所述病历文本中检索得到的与所述诊断疾病名相关的片段,确定所述诊断疾病名的相关片段集合;
[0008]基于所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,进行诊断多写检测。
[0009]根据本专利技术提供的一种诊断多写检测方法,所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度的确定步骤包括:
[0010]基于所述诊断疾病名的疾病要素和/或疾病知识,计算所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度。
[0011]根据本专利技术提供的一种诊断多写检测方法,所述基于所述诊断疾病名的疾病要素和/或疾病知识,计算所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,包括:
[0012]基于所述诊断疾病名的疾病要素和/或疾病知识,构建所述诊断疾病名的疾病图;
[0013]基于所述各片段中各分词之间的相关性,以及所述各片段的实体,构建所述各片段各自的片段图;
[0014]基于所述各片段各自的片段图以及所述诊断疾病名的疾病图,计算所述各片段分
别与所述诊断疾病名之间的相关度。
[0015]根据本专利技术提供的一种诊断多写检测方法,所述基于所述各片段各自的片段图以及所述诊断疾病名的疾病图,计算所述各片段分别与所述诊断疾病名之间的相关度,包括:
[0016]基于任一片段的上一片段图表示,对所述任一片段的片段图进行图内信息传递,得到当前片段图表示,并且,基于所述疾病图的上一疾病图表示,对所述疾病图进行图内信息传递,得到当前图表示;
[0017]基于所述当前片段图表示和所述当前疾病图表示之间的相关度,更新所述当前片段图表示和所述当前疾病图表示,并将更新后的所述当前片段图表示和所述当前疾病图表示分别作为所述上一片段图表示和所述上一疾病图表示,直至更新次数达到预设阈值;
[0018]基于所述更新次数达到预设阈值时所述当前片段图表示和所述当前疾病图表示之间的相关度,确定所述任一片段与所述诊断疾病名之间的相关度。
[0019]根据本专利技术提供的一种诊断多写检测方法,所述基于与所述诊断疾病名相关的疾病名在所述病历文本中所处的片段,以及从所述病历文本中检索得到的与所述诊断疾病名相关的片段,确定所述诊断疾病名的相关片段集合,包括:
[0020]从所述病历文本中包含的疾病名中,确定出所述病历文本中包含的本次确诊疾病名;
[0021]基于与所述诊断疾病名相关的本次确诊疾病名在所述病历文本中所处的片段,以及从所述病历文本中检索得到的与所述诊断疾病名相关的片段,确定所述诊断疾病名的相关片段集合。
[0022]根据本专利技术提供的一种诊断多写检测方法,所述从所述病历文本中包含的疾病名中,确定出所述病历文本中包含的本次确诊疾病名,包括:
[0023]检索所述病历文本中包含的疾病名;
[0024]基于所述疾病名在所述病历文本中的上下文,确定所述疾病名是否为所述本次确诊疾病名。
[0025]根据本专利技术提供的一种诊断多写检测方法,所述基于所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,进行诊断多写检测,包括:
[0026]从所述各片段分别与所述诊断疾病名之间的相关度中,确定最大相关度;
[0027]基于预设相关度阈值与所述最大相关度,确定所述诊断疾病名是否属于诊断多写。
[0028]根据本专利技术提供的一种诊断多写检测方法,所述基于所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,进行诊断多写检测,包括:
[0029]基于检测模型,计算所述各片段分别与所述诊断疾病名之间的相关度,并应用所述各片段分别与所述诊断疾病名之间的相关度进行诊断多写检测;
[0030]所述检测模型是基于第一负例样本和/或第二负例样本,以及正例样本训练得到;
[0031]其中,所述正例样本包括样本病历所对应的样本诊断疾病名,以及所述样本诊断疾病名的相关片段集合;
[0032]所述第一负例样本包括与所述样本诊断疾病名属于同一类疾病的第一疾病名,以及基于所述样本病历确定的所述第一疾病名的相关片段集合;
[0033]所述第二负例样本包括随机确定的第二疾病名,以及基于所述样本病历确定的所
述第二疾病名的相关片段集合。
[0034]本专利技术还提供一种诊断多写检测装置,包括:
[0035]获取单元,获取待检测的诊断疾病名;
[0036]召回单元,检测所述诊断疾病名所对应的病历文本中包含的疾病名,并基于与所述诊断疾病名相关的疾病名在所述病历文本中所处的片段,以及从所述病历文本中检索得到的与所述诊断疾病名相关的片段,确定所述诊断疾病名的相关片段集合;
[0037]检测单元,基于所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,进行诊断多写检测。
[0038]本专利技术还提供一种电子设备,包括:
[0039]存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一项所述诊断多写检测方法。
[0040]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述诊断多写检测方法。
[0041]本专利技术还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述诊断多写检测方法。
...

【技术保护点】

【技术特征摘要】
1.一种诊断多写检测方法,其特征在于,包括:获取待检测的诊断疾病名;检测所述诊断疾病名所对应的病历文本中包含的疾病名,并基于与所述诊断疾病名相关的疾病名在所述病历文本中所处的片段,以及从所述病历文本中检索得到的与所述诊断疾病名相关的片段,确定所述诊断疾病名的相关片段集合;基于所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,进行诊断多写检测。2.根据权利要求1所述的诊断多写检测方法,其特征在于,所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度的确定步骤包括:基于所述诊断疾病名的疾病要素和/或疾病知识,计算所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度。3.根据权利要求2所述的诊断多写检测方法,其特征在于,所述基于所述诊断疾病名的疾病要素和/或疾病知识,计算所述诊断疾病名的相关片段集合中的各片段分别与所述诊断疾病名之间的相关度,包括:基于所述诊断疾病名的疾病要素和/或疾病知识,构建所述诊断疾病名的疾病图;基于所述各片段中各分词之间的相关性,以及所述各片段的实体,构建所述各片段各自的片段图;基于所述各片段各自的片段图以及所述诊断疾病名的疾病图,计算所述各片段分别与所述诊断疾病名之间的相关度。4.根据权利要求3所述的诊断多写检测方法,其特征在于,所述基于所述各片段各自的片段图以及所述诊断疾病名的疾病图,计算所述各片段分别与所述诊断疾病名之间的相关度,包括:基于任一片段的上一片段图表示,对所述任一片段的片段图进行图内信息传递,得到当前片段图表示,并且,基于所述疾病图的上一疾病图表示,对所述疾病图进行图内信息传递,得到当前图表示;基于所述当前片段图表示和所述当前疾病图表示之间的相关度,更新所述当前片段图表示和所述当前疾病图表示,并将更新后的所述当前片段图表示和所述当前疾病图表示分别作为所述上一片段图表示和所述上一疾病图表示,直至更新次数达到预设阈值;基于所述更新次数达到预设阈值时所述当前片段图表示和所述当前疾病图表示之间的相关度,确定所述任一片段与所述诊断疾病名之间的相关度。5.根据权利要求1至4中任一项所述的诊断多写检测方法,其特征在于,所述基于与所述诊断疾病名相关的疾病名在所述病历文本中所处的片段,以及从所述病历文本中检索得到的与所述诊断疾病名相关的片段,确定所述诊断疾病名的相关片段集合,包括:从所述病历文本中包含的疾病名中,确定出所述病历文本中包含的本次确诊疾病名;基于与所述诊断疾病名相关的本次确诊疾病名在...

【专利技术属性】
技术研发人员:刘少辉吴及刘喜恩周开银尤心心
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1