院前急救病例文本的识别方法、装置、终端及存储介质制造方法及图纸

技术编号:33309501 阅读:21 留言:0更新日期:2022-05-06 12:20
本发明专利技术提供一种院前急救病例文本的识别方法、装置、终端及存储介质。该方法包括:对获取院前急救病例文本进行预处理,得到处理后的目标文本;根据目标文本的上下文动态地对每个词语进行编码,得到词向量;将词向量分别进行全局信息提取和局部信息提取,并将提取的全局信息和局部信息进行信息融合,得到特征向量;将特征向量输入到目标图卷积神经网络模型进行文本分类识别。本发明专利技术能够实现对相似专业词汇的准确提取,从而可以提高文本分类识别的准确率,且实现对词向量的全局特征和局部特征的提取,使得提取的特征向量表达更全面准确。使得提取的特征向量表达更全面准确。使得提取的特征向量表达更全面准确。

【技术实现步骤摘要】
院前急救病例文本的识别方法、装置、终端及存储介质


[0001]本专利技术涉及文本数据处理
,尤其涉及一种院前急救病例文本的识别方法、装置、终端及存储介质。

技术介绍

[0002]院前急救在救死扶伤的医疗救治中具有重要作用,院前急救系统主要依赖于接线员的经验以及工作效率。当接线员接到急救电话后,应在短时间内了解患者的发病原因、基本情况和生活状态,进行院前急救病例文本的急救患者的病情信息记录。深度学习在电子病历上信息抽取、静态预测等方面得到了应用,并取得了良好的结果,因此可以采用基于深度学习的文本分类模型提取院前急救病例文本中的语义特征,能够分析出急重症疾病的特征,并根据病情信息辅助接线员快速诊断,提升院前诊断的效率以及患者的救治率。
[0003]然而,专利技术人发现,目前院前急救病例文本中存在着大量的相似专业词汇,这些相似词汇极大提高了文本特征的获取难度,导致院前急救病例文本的分类准确率降低。

技术实现思路

[0004]本专利技术实施例提供了一种院前急救病例文本的识别方法、装置、终端及存储介质,以解决现有技术中识别相似专业词汇难度大,导致院前急救病例文本的分类准确率降低的问题。
[0005]第一方面,本专利技术实施例提供了一种院前急救病例文本的识别方法,包括:
[0006]对获取院前急救病例文本进行预处理,得到处理后的目标文本;
[0007]根据所述目标文本的上下文动态地对每个词语进行编码,得到词向量;
[0008]将所述词向量分别进行全局信息提取和局部信息提取,并将提取的全局信息和局部信息进行信息融合,得到特征向量;
[0009]将所述特征向量输入到目标图卷积神经网络模型进行文本分类识别。
[0010]在一种可能的实现方式中,在所述将所述特征向量输入到目标图卷积神经网络模型进行文本分类识别之前,还包括:
[0011]对预设图卷积神经网络模型中进行模型训练,得到所述目标图卷积神经网络模型,其中,在进行模型训练时,采用激活函数控制激活神经元。
[0012]在一种可能的实现方式中,所述激活函数为
[0013][0014]其中,β
c
表示第c个句子对应的激活状态参数,σ表示第一激活函数,W表示卷积操作,x
c,h
表示第c个句子中第h个特征向量,H表示词向量总数。
[0015]在一种可能的实现方式中,所述对预设图卷积神经网络模型中进行模型训练,得到所述目标图卷积神经网络模型,包括:
[0016]根据得到所述特征向量的方法得到训练数据和测试数据;
[0017]将所述训练数据输入预设图卷积神经网络模型中进行模型训练,得到初始图卷积神经网络模型;
[0018]采用所述测试数据对所述初始图卷积神经网络模型进行测试,得到分类准确率;
[0019]当所述分类准确率大于或等于预设分类准确率时,确定所述初始图卷积神经网络模型为目标图卷积神经网络模型;
[0020]当所述分类准确率小于预设分类准确率时,继续对所述初始图卷积神经网络模型进行模型训练,直到分类准确率大于或等于预设分类准确率时结束训练。
[0021]在一种可能的实现方式中,所述预设图卷积神经网络模型中包括两层GCN、一层Meta

ACON和softmax分类器;
[0022]在训练所述预设图卷积神经网络模型中的所述两层GCN时,根据确定高阶邻域信息;
[0023]其中,L
j+1
表示第(j+1)层GCN中的邻域信息,ρ表示第二激活函数,A表示特征向量矩阵对应的邻接矩阵,表示归一化的邻接矩阵,D表示所述邻接矩阵的度矩阵,L
j
表示第j层GCN中的邻域信息,j表示大于等于0的整数,其中,L0=G,G表示所述训练数据或者所述测试数据对应的特征向量矩阵,W
j
表示第j层GCN中权重矩阵。
[0024]在一种可能的实现方式中,邻接矩阵确定的方法包括:
[0025]根据所述训练数据对应的文本中的特征向量,计算任两个特征向量之间的边的权重;
[0026]根据所述训练数据对应的文本中的特征向量,计算任一特征向量在所述文本中出现的概率;
[0027]根据所述权重和所述概率,确定邻接矩阵。
[0028]在一种可能的实现方式中,所述对获取院前急救病例文本进行预处理,得到处理后的目标文本,包括:
[0029]获取院前急救病例文本;
[0030]从所述院前急救病例文本中筛选疾病信息,并将筛选出的疾病信息进行文本清洗,得到清洗后的文本;
[0031]根据所述清洗后的文本和预设分类标准,确定对应的格式化标签;
[0032]在预设类别表查找设置了格式化标签的文本对应的类别,得到处理后的目标文本。
[0033]第二方面,本专利技术实施例提供了一种院前急救病例文本的识别装置,包括:
[0034]预处理模块,用于对获取院前急救病例文本进行预处理,得到处理后的目标文本;
[0035]编码模块,用于根据所述目标文本的上下文动态地对每个词语进行编码,得到词向量;
[0036]特征提取模块,用于将所述词向量分别进行全局信息提取和局部信息提取,并将提取的全局信息和局部信息进行信息融合,得到特征向量;
[0037]分类模块,用于将所述特征向量输入到目标图卷积神经网络模型进行文本分类识
别。
[0038]第三方面,本专利技术实施例提供了一种终端,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述的院前急救病例文本的识别方法的步骤。
[0039]第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述的院前急救病例文本的识别方法的步骤。
[0040]本专利技术实施例提供一种院前急救病例文本的识别方法、装置、终端及存储介质,通过对获取院前急救病例文本进行预处理,得到处理后的目标文本;根据所述目标文本的上下文动态地对每个词语进行编码,得到词向量,实现对相似专业词汇的准确提取,从而可以提高文本分类识别的准确率;将所述词向量分别进行全局信息提取和局部信息提取,并将提取的全局信息和局部信息进行信息融合,得到特征向量,实现对词向量的全局特征和局部特征的提取,使得提取的特征向量表达更全面准确;将所述特征向量输入到目标图卷积神经网络模型进行文本分类识别,可以得到准确率更该的分类。
附图说明
[0041]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种院前急救病例文本的识别方法,其特征在于,包括:对获取院前急救病例文本进行预处理,得到处理后的目标文本;根据所述目标文本的上下文动态地对每个词语进行编码,得到词向量;将所述词向量分别进行全局信息提取和局部信息提取,并将提取的全局信息和局部信息进行信息融合,得到特征向量;将所述特征向量输入到目标图卷积神经网络模型进行文本分类识别。2.根据权利要求1所述的院前急救病例文本的识别方法,其特征在于,在所述将所述特征向量输入到目标图卷积神经网络模型进行文本分类识别之前,还包括:对预设图卷积神经网络模型中进行模型训练,得到所述目标图卷积神经网络模型,其中,在进行模型训练时,采用激活函数控制激活神经元。3.根据权利要求2所述的院前急救病例文本的识别方法,其特征在于,所述激活函数为其中,β
c
表示第c个句子对应的激活状态参数,σ表示第一激活函数,W表示卷积操作,x
c,h
表示第c个句子中第h个特征向量,H表示词向量总数。4.根据权利要求2所述的院前急救病例文本的识别方法,其特征在于,所述对预设图卷积神经网络模型中进行模型训练,得到所述目标图卷积神经网络模型,包括:根据得到所述特征向量的方法得到训练数据和测试数据;将所述训练数据输入预设图卷积神经网络模型中进行模型训练,得到初始图卷积神经网络模型;采用所述测试数据对所述初始图卷积神经网络模型进行测试,得到分类准确率;当所述分类准确率大于或等于预设分类准确率时,确定所述初始图卷积神经网络模型为目标图卷积神经网络模型;当所述分类准确率小于预设分类准确率时,继续对所述初始图卷积神经网络模型进行模型训练,直到分类准确率大于或等于预设分类准确率时结束训练。5.根据权利要求4所述的院前急救病例文本的识别方法,其特征在于,所述预设图卷积神经网络模型中包括两层GCN、一层Meta

ACON和softmax分类器;在训练所述预设图卷积神经网络模型中的所述两层GCN时,根据确定高阶邻域信息;其中,L
j+1
表示第(j+1)层GCN中的邻域信息,ρ表示第二激活函数,A表示特...

【专利技术属性】
技术研发人员:生龙张旭田丰赵继军陈湘国马晓雨魏忠诚王巍王超
申请(专利权)人:河北工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1