提取临床发现事件的方法、装置、设备及可读存储介质制造方法及图纸

技术编号:36799069 阅读:23 留言:0更新日期:2023-03-08 23:26
本发明专利技术提供了提取临床发现事件的方法、装置、设备及可读存储介质,包括:获取病情描述文本,并在所述病情描述文本的前部添加字符串,生成第一文本;将所述第一文本输入至训练好的深度学习模型进行预测,并获取预测结果;将所述预测结果还原为多个三元组,其中,每一所述三元组包括主体词在所述病情描述文本中的首尾位置、以及每一个类别对应的值在所述病情描述文本中的首尾位置;根据多个所述三元组,生成由多个四元组数据构成的临床发现事件。解决了无法根据患者的描述提取到对应的案例、或提取到的案例不准确的问题。取到的案例不准确的问题。取到的案例不准确的问题。

【技术实现步骤摘要】
提取临床发现事件的方法、装置、设备及可读存储介质


[0001]本专利技术属于人工智能领域,特别涉及一种提取临床发现事件的方法、装置、设备及可读存储介质。

技术介绍

[0002]随着医疗信息化的不断发展,尤其是互联网医院和医疗大数据分析的逐渐普及,在许多应用场景需要借助算法和机器对患者的病情描述等医学文本进行分析和理解,从而为下一步的诊疗行动或科研活动提供数据支持。例如,在预检分诊时,通过从患者病情描述中提取临床发现事件,为智能化预检分诊提供判断依据;在医疗大数据分析场景,通过从患者病史、医学检查报告中提取临床发现事件,对医学文本进行信息结构化提取和处理,为后续数据分析提供数据准备。然而,在现有技术存在无法根据患者的描述提取到对应的案例、或者提取到的案例不准确的问题。
[0003]有鉴于此,提出本申请。

技术实现思路

[0004]本专利技术公开了一种提取临床发现事件的方法、装置、设备及可读存储介质,旨在解决无法根据患者的描述提取到对应的案例、或提取到的案例不准确的问题。
[0005]本专利技术第一实施例提供了一种提取临床发现事件的方法,包括:
[0006]获取病情描述文本,并在所述病情描述文本的前部添加第一字符串,生成第一文本;
[0007]将所述第一文本输入至训练好的深度学习模型进行预测,并获取预测结果;
[0008]将所述预测结果还原为多个三元组,其中,每一所述三元组包括主体词在所述病情描述文本中的首尾位置、以及每一个类别对应的值在所述病情描述文本中的首尾位置
[0009]根据多个所述三元组,生成由多个四元组数据构成的临床发现事件。
[0010]优选地,在所述将所述第一文本输入训练好的深度学习模型进行预测,并获取预测结果之前,还包括对深度学习模型进行训练,具体为:
[0011]获取训练数据中的病情描述文本,并将所述病情描述文本转化为文本id和文本向量;
[0012]根据所述文本id生成主体词的的首尾位置,并根据所述主体词的首尾位置,从所述文本向量中抽取出与所述主体词首和尾对应的主体词文本向量;
[0013]对所述主体词文本向量进行条件正规化,并生成正规化向量;
[0014]将所述正规化向量传入一个全连接层接一个二分类器,分别预测主体词的每一个类别所对应的值的首尾位置。
[0015]优选地,所述获取训练数据中的病情描述文本,并将所述病情描述文本转化为文本向量,具体为:
[0016]获取训练数据中的病情描述文本,将所述病情描述文本转为BERT模型的文本id,
并将所述BERT模型的文本id传至BERT的编码器;
[0017]获取所述编码器生成的文本向量。
[0018]优选地,所述根据多个所述三元组,生成由多个四元组数据构成的临床发现事件,具体为:
[0019]将首尾位置相同的主体词的三元组进行合并,同时将相同类别的值进行合并,生成一个临床发现事件的四元组数据;
[0020]将描述词为所述第一字符串的替换为空串,并根据对照表逆向将主体词中出现的替换词替换、以及逆向将发生状态中的虚词替换,生成由多个四元组数据生成构成的临床发现事件。
[0021]本专利技术第二实施例提供了一种提取临床发现事件的装置,包括:
[0022]病情描述文本获取单元,用于获取病情描述文本,并在所述病情描述文本的前部添加第一字符串,生成第一文本;
[0023]预测结果获取单元,用于将所述第一文本输入至训练好的深度学习模型进行预测,并获取预测结果;
[0024]还原单元,用于将所述预测结果还原为多个三元组,其中,每一所述三元组包括主体词在所述病情描述文本中的首尾位置、以及每一个类别对应的值在所述病情描述文本中的首尾位置;
[0025]临床发现事件生成单元,根据多个所述三元组,生成由多个四元组数据构成的临床发现事件。
[0026]优选地,所述预测结果获取单元还包括深度学习模型进行训练模块,具体用于:
[0027]获取训练数据中的病情描述文本,并将所述病情描述文本转化为文本id和文本向量;
[0028]根据所述文本id生成主体词的的首尾位置,并根据所述主体词的首尾位置,从所述文本向量中抽取出与所述主体词首和尾对应的主体词文本向量;
[0029]对所述主体词文本向量进行条件正规化,并生成正规化向量;
[0030]将所述正规化向量传入一个全连接层接一个二分类器,分别预测主体词的每一个类别所对应的值的首尾位置。
[0031]优选地,所述获取训练数据中的病情描述文本,并将所述病情描述文本转化为文本向量,具体为:
[0032]获取训练数据中的病情描述文本,将所述病情描述文本转为BERT模型的文本id,并将所述BERT模型的文本id传至BERT的编码器;
[0033]获取所述编码器生成的文本向量。
[0034]优选地,所述临床发现事件生成单元,具体用于:
[0035]将首尾位置相同的主体词的三元组进行合并,同时将相同类别的值进行合并,生成一个临床发现事件的四元组数据;
[0036]将描述词为所述第一字符串的替换为空串,并根据对照表逆向将主体词中出现的替换词替换、以及逆向将发生状态中的虚词替换,生成由多个四元组数据生成构成的临床发现事件。
[0037]本专利技术第三实施例提供了一种提取临床发现事件的设备,包括存储器以及处理
器,所述存储器内存储有计算机程序,所述计算机程序能够被所述处理器执行,以实现如上任意一项所述的一种提取临床发现事件的方法。
[0038]本专利技术第四实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序能够被所述计算机可读存储介质所在设备的处理器执行,以实现如权利要求上任意一项所述的一种提取临床发现事件的方法。
[0039]基于本专利技术提供的一种提取临床发现事件的方法、装置、设备及可读存储介质,通过在获取到的病情描述文本的前部添加字符串以生成第一文本,通过训练好的深度学习模型对第一文本进行预测,以获取预测结果,将所述预测结果还原为多个三元组,根据多个所述三元组,生成由多个四元组数据构成的临床发现事件,解决了无法根据患者的描述提取到对应的案例、或提取到的案例不准确的问题。
附图说明
[0040]图1是本专利技术第一实施例提供的一种提取临床发现事件的方法的流程示意图;
[0041]图2是本专利技术提供的模型算法流程示意图;
[0042]图3是本专利技术第一实施例提供的一种提取临床发现事件的装置的模块示意图。
具体实施方式
[0043]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0044]为了更好的理解本专利技术的技术方案,下面本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提取临床发现事件的方法,其特征在于,包括:获取病情描述文本,并在所述病情描述文本的前部添加第一字符串,生成第一文本;将所述第一文本输入至训练好的深度学习模型进行预测,并获取预测结果;将所述预测结果还原为多个三元组,其中,每一所述三元组包括主体词在所述病情描述文本中的首尾位置、以及每一个类别对应的值在所述病情描述文本中的首尾位置;根据多个所述三元组,生成由多个四元组数据构成的临床发现事件。2.根据权利要求1所述的一种提取临床发现事件的方法,其特征在于,在将所述第一文本输入至训练好的深度学习模型进行预测,并获取预测结果之前,还包括对深度学习模型进行训练,具体为:获取训练数据中的病情描述文本,并将所述病情描述文本转化为文本id和文本向量;根据所述文本id生成主体词的的首尾位置,并根据所述主体词的首尾位置,从所述文本向量中抽取出与所述主体词首和尾对应的主体词文本向量;对所述主体词文本向量进行条件正规化,并生成正规化向量;将所述正规化向量传入一个全连接层接一个二分类器,分别预测主体词的每一个类别所对应的值的首尾位置。3.根据权利要求2所述的一种提取临床发现事件的方法,其特征在于,所述获取训练数据中的病情描述文本,并将所述病情描述文本转化为文本id和文本向量,具体为:获取训练数据中的病情描述文本,将所述病情描述文本转为BERT模型的文本id,并将所述BERT模型的文本id传至BERT的编码器;获取所述编码器生成的文本向量。4.根据权利要求1所述的一种提取临床发现事件的方法,其特征在于,所述根据多个所述三元组,生成由多个四元组数据构成的临床发现事件,具体为:将首尾位置相同的主体词的三元组进行合并,同时将相同类别的值进行合并,生成一个临床发现事件的四元组数据;将描述词为所述第一字符串的替换为空串,并根据对照表逆向将主体词中出现的替换词替换、以及逆向将发生状态中的虚词替换,生成由多个四元组数据生成构成的临床发现事件。5.一种提取临床发现事件的装置,其特征在于,包括:病情描述文本获取单元,用于获取病情描述文本,并在所述病情描述文本的前部添加第一字符串,生成第一文本;预测结果获取单元,用于将所述第一文本输入至训练好...

【专利技术属性】
技术研发人员:施建安庄一波关涛洪剑潇赵友平陈紊森
申请(专利权)人:厦门市易联众易惠科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1