System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于人工智能的医疗文本不良事件发现方法及系统技术方案_技高网

一种基于人工智能的医疗文本不良事件发现方法及系统技术方案

技术编号:40466279 阅读:7 留言:0更新日期:2024-02-22 23:20
本发明专利技术公开了一种基于人工智能的医疗文本不良事件发现方法及系统,属于医疗数据智能规范技术领域。该方法包括:(1)医疗文本事件提取算法构建;(2)不良事件规则引擎构建及运行。本发明专利技术通过对医疗文本语义理解,快速准确的自动提取医疗文本中的不良事件;医疗文本事件提取算法与医疗文本不良事件规则引擎协作的医疗文本不良事件判断方法,将医疗文本事件提取算法与医疗文本不良事件判断过程解耦。本发明专利技术的方法不依赖传统人工对医疗文本的判读,可以自动的快速批量化提取医疗文本中的不良事件;改善了传统基于词库关键词匹配的不良事件提取方法准确率较低的问题,通过对医疗文本语义理解,更准确地识别医疗文本中不良事件。

【技术实现步骤摘要】

本专利技术属于医疗数据智能规范,特别涉及一种数据驱动的用于医院医疗文本中不良事件发现,帮助医院规范治疗过程,改善医疗服务质量的人工智能方法及系统。


技术介绍

1、医院医疗过程中产生的不良事件通常会记录在诊断、住院记录等医疗文本中。不良事件的发现,对于医院进行医疗过程的规范,医疗服务质量的改善具有重要作用。目前不良事件的发现方法主要包括以下两种:

2、1、人工阅读,通过人工阅读医疗过程中产生的文本,判断不良事件是否发生,以及不良事件类型。人工阅读的方法需要大量人力,且由于个人经验及能力不同,会导致不良事件判断质量难以统一,不具备对于大量医疗过程进行不良事件发现的可行性;

3、2、基于不良事件名词库的匹配方法,该方法提前定义不良事件的词库,通过对医疗过程中产生的文本进行词的匹配,判断不良事件是否发生,以及不良事件类型。不良事件名词库匹配的方法无法判断文本中的上下文语义信息,导致某些情况下的错误提取,或者对于灵活的文本书写方式,无法做到充分提取。

4、基于以上两种现行的医疗文本不良事件发现方法的不足,有必要专利技术一种新的以数据驱动的人工智能算法,能够对医疗文本进行语义理解,完成医疗文本中不良事件的发现,提高医疗文本中不良事件发现的准确率。


技术实现思路

1、为了克服上述现有医疗文本不良事件发现方法效率低,准确率低的问题,本专利技术提供了一种基于人工智能的医疗文本不良事件发现方法及系统,该方法以数据驱动,使用人工智能算法,进行医疗文本语义理解,更准确地识别医疗文本中不良事件。

2、为了实现上述目的,本专利技术采用的技术方案是:

3、本专利技术的目的之一是提供一种基于人工智能的医疗文本不良事件发现方法,包括:

4、(1)医疗文本事件提取算法构建

5、建立医疗文本语料库,采用bert模型,对医疗文本语料库进行无监督/自监督训练,生成medbert模型;以medbert模型输出作为医疗文本语义表达,实现医疗文本命名实体提取算法,提取实体;以医疗文本命名实体和medbert模型语义表达为输入,实现医疗文本事件提取算法,将属于同一事件的实体作为事件元素,统一分配到同一事件id下;

6、(2)不良事件规则引擎构建及运行

7、构建不良事件规则引擎,不良事件规则引擎包括不良事件规则库和不良事件匹配算法,通过不良事件匹配算法比对医疗文本事件提取算法输出的医疗事件与不良事件规则库中的每条不良事件的相似度,相似度大于阈值,则将医疗文本事件提取算法输出的医疗事件指定为对应类别的不良事件。

8、进一步的,步骤(1)中,所述医疗文本语料库的具体构建方法是将不同类别的医疗文本分类别采样,并将采样结果合并,形成医疗文本语料库;

9、优选的,步骤(1)中,所述医疗文本包括但不限于诊断、住院记录、检查和遗嘱。

10、进一步的,步骤(1)中,所述实体包括但不限于疾病、症状、检查和部位。

11、进一步的,步骤(2)中,所述不良事件规则库由若干条不良事件定义组成,每条不良事件定义包含与医疗文本时间提取算法输出格式一致的事件元素。

12、进一步的,步骤(2)中,所述不良事件匹配算法中,设医疗文本事件提取算法输出的事件为e1-预测,不良事件规则库中某条不良事件规则定义为e2-规则,不良事件匹配算法计算e1与e2的相似度为sim(e1,e2),计算公式如下:

13、sim(e1,e2)=[textsim(疾病1,疾病2)+textsim(症状1,症状2)+textsim(检查1,检查2)+textsim(部位1,部位2)]/4.0

14、上式中,textsim采用短文本匹配算法。

15、优选的,本专利技术的一优选实施方案中,textsim中使用编辑距离算法。

16、本专利技术的另一目的是提供一种基于人工智能的医疗文本不良事件发现系统,包括:医疗文本语料库生成模块、medbert模型生成模块、医疗文本事件提取算法模块、不良事件规则库生成模块、不良事件匹配算法模块;

17、所述医疗文本语料库生成模块用于将不同类别的医疗文本分类别采样,并将采样结果合并,形成医疗文本语料库;

18、所述medbert模型生成模块用于对医疗文本语料库生成模块生成的医疗文本语料库进行无监督/自监督训练,采用bert模型生成medbert模型,

19、所述医疗文本事件提取算法模块用于以医疗文本命名实体和medbert模型语义表达为输入,实现医疗文本事件提取;

20、所述不良事件规则库生成模块用于将若干条不良事件定义形成不良事件规则库,每条不良事件定义包含与医疗文本时间提取算法输出格式一致的事件元素;

21、所述不良事件匹配算法模块用于比对医疗文本事件提取算法模块输出的医疗事件与不良事件规则库生成模块中的每条不良事件的相似度,相似度大于阈值,则将医疗文本事件提取算法模块输出的医疗事件指定为对应类别的不良事件。

22、本专利技术还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述基于人工智能的医疗文本不良事件发现方法。

23、本专利技术的有益技术效果:

24、1.本专利技术提出了一种以数据驱动的人工智能方法,通过对医疗文本语义理解,快速准确的自动提取医疗文本中的不良事件;医疗文本事件提取算法与医疗文本不良事件规则引擎协作的医疗文本不良事件判断方法,将医疗文本事件提取算法与医疗文本不良事件判断过程解耦。

25、2.本专利技术的方法不依赖传统人工对医疗文本的判读,可以自动的快速批量化提取医疗文本中的不良事件。

26、3.本专利技术的方法改善了传统基于词库关键词匹配的不良事件提取方法准确率较低的问题,通过对医疗文本语义理解,更准确地识别医疗文本中不良事件。

本文档来自技高网...

【技术保护点】

1.一种基于人工智能的医疗文本不良事件发现方法,其特征在于,包括:

2.根据权利要求1所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(1)中,所述医疗文本语料库的具体构建方法是将不同类别的医疗文本分类别采样,并将采样结果合并,形成医疗文本语料库。

3.根据权利要求2所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(1)中,所述医疗文本包括但不限于诊断、住院记录、检查和遗嘱。

4.根据权利要求3所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(1)中,所述实体包括但不限于疾病、症状、检查和部位。

5.根据权利要求1所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(2)中,所述不良事件规则库由若干条不良事件定义组成,每条不良事件定义包含与医疗文本时间提取算法输出格式一致的事件元素。

6.根据权利要求5所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(2)中,所述不良事件匹配算法中,设医疗文本事件提取算法输出的事件为E1-预测,不良事件规则库中某条不良事件规则定义为E2-规则,不良事件匹配算法计算E1与E2的相似度为Sim(E1,E2),计算公式如下:

7.根据权利要求6所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:TextSim中使用编辑距离算法。

8.一种基于人工智能的医疗文本不良事件发现系统,其特征在于,包括:医疗文本语料库生成模块、MedBert模型生成模块、医疗文本事件提取算法模块、不良事件规则库生成模块、不良事件匹配算法模块;

9.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-7任一项所述基于人工智能的医疗文本不良事件发现方法。

...

【技术特征摘要】

1.一种基于人工智能的医疗文本不良事件发现方法,其特征在于,包括:

2.根据权利要求1所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(1)中,所述医疗文本语料库的具体构建方法是将不同类别的医疗文本分类别采样,并将采样结果合并,形成医疗文本语料库。

3.根据权利要求2所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(1)中,所述医疗文本包括但不限于诊断、住院记录、检查和遗嘱。

4.根据权利要求3所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(1)中,所述实体包括但不限于疾病、症状、检查和部位。

5.根据权利要求1所述的基于人工智能的医疗文本不良事件发现方法,其特征在于:步骤(2)中,所述不良事件规则库由若干条不良事件定义组成,每条不良事件定义包含与医疗文本时间提取算法输出格式一致的事件元素。<...

【专利技术属性】
技术研发人员:李靖
申请(专利权)人:北京贝马科斯技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1