System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种获取病历文本中实体关系的数据处理系统技术方案_技高网

一种获取病历文本中实体关系的数据处理系统技术方案

技术编号:41733286 阅读:5 留言:0更新日期:2024-06-19 12:54
本发明专利技术涉及一种获取病历文本中实体关系的数据处理系统,所述系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:根据候选病历文本集,获取候选实体列表集,将候选实体列表集输入至初始的神经网络模型中,获取第二候选标签列表集和第二候选优先级列表,基于第二候选优先级列表采用不同方法获取关键参数,不断调整关键参数获取目标实体关系模型,获取指定病历文本和指定实体列表,获取目标实体关系列表,本发明专利技术结合多个模型获取病历文本中的实体,基于样本数据不断调整各个模型的参数,基于模型训练过程中的匹配情况,采用不同的方式调节模型的参数,提高了获取到病历文本实体关系的准确性。

【技术实现步骤摘要】

本专利技术涉及文本处理,特别是涉及一种获取病历文本中实体关系的数据处理系统


技术介绍

1、随着互联网技术的不断发展,病历文本呈现电子化,病历文本作为判断疾病、治疗过程及疾病发展状态检测的重要文档,包含了大量的实体,实体与实体之间会存在相关的关系,这些实体关系对于理解病历内容、辅助医生决策、进行与疾病相关联数据挖掘等具有重要意义,如何清晰明了的获取病历文本中实体之间的关系成为热门研究方向,现有技术中,基于规则从病历文本中抽取出实体,在实体关系抽取的过程中,利用规则对预处理后的非结构文本进行匹配,从而提取出实体关系三元组,上述获取实体关系的方法存在的问题有:规则制定复杂,降低了获取到病历实体关系的效率,当病历文本类型多样化时,不能够准确识别出病历文本中的实体与实体之间的实体关系,使得获取到的病历文本中实体关系的准确性较低。


技术实现思路

1、针对上述技术问题,本专利技术采用的技术方案为:一种获取病历文本中实体关系的数据处理系统,系统包括:β个预设实体关系标签、候选病历文本集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:

2、s100,根据候选病历文本集,获取候选病历文本集对应的候选实体列表集,其中,所述候选实体列表集包括若干个候选实体列表,所述候选实体列表包括若干个候选实体。

3、s200,将候选实体列表集输入至初始的神经网络模型中,获取第二候选标签列表集和第二候选优先级列表g={g1,……,gx,……,gp},gx为第x个第二候选标签对应的第二候选优先级,x=1……p,p为第二候选优先级的数量。

4、s300,当ε/p≥f0时,采用第一处理方式获取初始的神经网络模型对应的关键参数γ,其中,ε为g中第二候选优先级不为1的数量,f0为预设的优先级阈值。

5、s400,当ε/p<f0时,采用第二处理方式获取初始的神经网络模型对应的关键参数γ。

6、s500,不断调整关键参数γ,直到满足预设的目标条件时以获取到目标实体关系模型,其中,所述预设的目标条件为:γ≤γ0,γ0为预设的关键参数阈值。

7、s600,获取指定病历文本,其中,所述指定病历文本为待获取实体与实体之间关系的病历文本。

8、s700,根据指定病历文本,获取指定病历文本对应的指定实体列表,其中,所述指定实体列表包括若干个指定实体,所述指定实体的获取方式与所述候选实体的获取方式一致。

9、s800,将指定实体列表输入至目标实体关系模型中,获取指定病历文本对应的目标实体关系列表,其中,所述目标实体关系列表包括若干个目标实体关系,所述目标实体关系包括基于目标实体关系模型匹配到的预设实体关系标签以及匹配到此预设实体标签对应的两个指定实体。

10、本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的一种获取病历文本中实体关系的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:

11、本专利技术为一种获取病历文本中实体关系的数据处理系统,所述系统包括:预设实体关系标签、候选病历文本集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:根据候选病历文本集,获取候选病历文本集对应的候选实体列表集,将候选实体列表集输入至初始的神经网络模型中,获取第二候选标签列表集和第二候选优先级列表,当第二候选优先级对应的参数满足预设条件时,采用第一处理方式获取初始的神经网络模型对应的关键参数,当第二候选优先级对应的参数不满足预设条件时,采用第二处理方式获取初始的神经网络模型对应的关键参数,不断调整关键参数γ,直到满足预设的目标条件时以获取到目标实体关系模型,获取指定病历文本,根据指定病历文本,获取指定病历文本对应的指定实体列表,将指定实体列表输入至目标实体关系模型中,获取指定病历文本对应的目标实体关系列表,本专利技术结合多个模型获取病历文本中的实体,基于样本数据不断调整各个模型的参数,提高了获取到病历文本中实体的准确性,进而使得获取到实体关系的准确性较高,利用训练好的模型获取病历文本中的实体关系,基于模型训练过程中的匹配情况,采用不同的方式调节模型的参数,提高了获取到病历文本实体关系的准确性。

12、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种获取病历文本中实体关系的数据处理系统,其特征在于,所述系统包括:β个预设实体关系标签、候选病历文本集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的获取病历文本中实体关系的数据处理系统,其特征在于,在S100中通过如下步骤获取候选实体:

3.根据权利要求2所述的获取病历文本中实体关系的数据处理系统,其特征在于,所述预设实体标签为预先设置的实体对应的标签,其中,所述实体对应的标签为表征用户身体状态的词对应的标签。

4.根据权利要求1所述的获取病历文本中实体关系的数据处理系统,其特征在于,所述第二候选标签列表集包括若干个第二候选标签列表,所述第二候选标签列表包括若干个第二候选标签,所述第二候选标签为基于初始的神经网络模型获取到的每个候选实体列表中存在的两个候选实体对应的预设实体关系标签。

5.根据权利要求1所述的获取病历文本中实体关系的数据处理系统,其特征在于,所述第二候选优先级为基于初始的神经网络模型获取到的候选实体与候选实体之间的关系匹配到预设实体关系标签的匹配度。

6.根据权利要求1所述的获取病历文本中实体关系的数据处理系统,其特征在于,在S300中通过如下步骤获取γ:

7.根据权利要求6所述的获取病历文本中实体关系的数据处理系统,其特征在于,在S400中通过如下步骤获取γ:

...

【技术特征摘要】

1.一种获取病历文本中实体关系的数据处理系统,其特征在于,所述系统包括:β个预设实体关系标签、候选病历文本集、处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的获取病历文本中实体关系的数据处理系统,其特征在于,在s100中通过如下步骤获取候选实体:

3.根据权利要求2所述的获取病历文本中实体关系的数据处理系统,其特征在于,所述预设实体标签为预先设置的实体对应的标签,其中,所述实体对应的标签为表征用户身体状态的词对应的标签。

4.根据权利要求1所述的获取病历文本中实体关系的数据处理系统,其特征在于,所述第二候选标签列表集包...

【专利技术属性】
技术研发人员:刘立宇赵瑞莹初乃强
申请(专利权)人:生命奇点北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1