System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请适用于人工智能,尤其涉及一种基于强化学习的病例关系抽取方法、装置、设备及介质。
技术介绍
1、在医疗领域中,通常将病历、病理、手术等各种文书数据作为数据源,分别从这些数据源中进行信息抽取,信息抽取是自然语言处理中的一项基本任务,通过对非结构化文本进行处理抽取结构化信息,作为后续自然语言处理任务的输入。关系抽取是信息抽取技术中的重要内容,对句子中两个实体之间的语义关系进行分类,自动识别出一对概念和联系这对概念的语义关系,但在关系抽取过程中,现有技术中,一般通过监督学习进行抽取,监督学习方法,需要精准标注的数据集,当精准标注的数据集较少时,使关系抽取精度较低,因此,在关系抽取过程中,如何提高关系抽取精度成为亟需解决的问题。
技术实现思路
1、有鉴于此,本申请实施例提供了一种基于强化学习的病例关系抽取方法、装置、设备及介质,以解决在关系抽取过程中,抽取精度较低的问题。
2、第一方面,本申请实施例提供一种基于强化学习的病例关系抽取方法,所述病例关系抽取方法包括:
3、获取待抽取病例图像,将所述待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在所述待抽取病例图像中的像素位置;
4、对所述文本表达和所述像素位置分别进行特征编码,得到对应文本表达的关键文本特征以及位置标签特征;
5、针对任一个文本表达,对所述关键文本特征与所述位置标签特征进行解码识别,得到对应所述文本表达的识别结果,根据所述识别结果,确定对应所述文本表达的标
6、从所有的标签类别中筛选出与预设实体标签匹配的标签类别作为目标类别,根据所述目标类别,确定所述目标类别确定对应的目标文本表达,根据所述目标文本表达对应的位置信息,选取与所述目标文本表达关联的n个候选文本表达,n为大于1的整数;
7、针对任一候选文本表达,将所述目标文本表达与所述候选文本表达进行文本组合,得到对应的文本表达对,通过预设强化学习分类器,对所述文本表达对进行关联关系预测,得到预测关联结果,遍历n个候选文本表达,得到n个预测关联结果;
8、根据所述n个预测关联结果,确定与所述目标文本表达存在关联的关联候选文本表达,将所述关联候选文本表达进行组合,得到对应的组合文本,将所述目标文本表达对应的识别结果与所述组合文本表达对应的识别结果作为对应关联关系的抽取结果。
9、第二方面,本申请实施例提供一种基于强化学习的病例关系抽取装置,所述病例关系抽取装置包括:
10、获取模块,用于获取待抽取病例图像,将所述待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在所述待抽取病例图像中的像素位置;
11、编码模块,用于对所述文本表达和所述像素位置分别进行特征编码,得到对应文本表达的关键文本特征以及位置标签特征;
12、解码模块,用于针对任一个文本表达,对所述关键文本特征与所述位置标签特征进行解码识别,得到对应所述文本表达的识别结果,根据所述识别结果,确定对应所述文本表达的标签类别;
13、筛选模块,用于从所有的标签类别中筛选出与预设实体标签匹配的标签类别作为目标类别,根据所述目标类别,确定所述目标类别确定对应的目标文本表达,根据所述目标文本表达对应的位置信息,选取与所述目标文本表达关联的n个候选文本表达,n为大于1的整数;
14、预测模块,用于针对任一候选文本表达,将所述目标文本表达与所述候选文本表达进行文本组合,得到对应的文本表达对,通过预设强化学习分类器,对所述文本表达对进行关联关系预测,得到预测关联结果,遍历n个候选文本表达,得到n个预测关联结果;
15、抽取模块,用于根据所述n个预测关联结果,确定与所述目标文本表达存在关联的关联候选文本表达,将所述关联候选文本表达进行组合,得到对应的组合文本,将所述目标文本表达对应的识别结果与所述组合文本表达对应的识别结果作为对应关联关系的抽取结果。
16、第三方面,本申请实施例提供一种终端设备,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于强化学习的病例关系抽取方法。
17、第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的基于强化学习的病例关系抽取方法。
18、本申请实施例与现有技术相比存在的有益效果是:
19、获取待抽取病例图像,将待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在待抽取病例图像中的像素位置,对文本表达和像素位置分别进行特征编码,得到对应文本表达的关键文本特征以及位置标签特征,针对任一个文本表达,对关键文本特征与位置标签特征进行解码识别,得到对应文本表达的识别结果,根据识别结果,确定对应文本表达的标签类别,从所有的标签类别中筛选出与预设实体标签匹配的标签类别作为目标类别,根据目标类别,确定目标类别确定对应的目标文本表达,根据目标文本表达对应的位置信息,选取与目标文本表达关联的n个候选文本表达,n为大于1的整数,针对任一候选文本表达,将目标文本表达与候选文本表达进行文本组合,得到对应的文本表达对,通过预设强化学习分类器,对文本表达对进行关联关系预测,得到预测关联结果,遍历n个候选文本表达,得到n个预测关联结果,根据n个预测关联结果,确定与目标文本表达存在关联的关联候选文本表达,将关联候选文本表达进行组合,得到对应的组合文本,将目标文本表达对应的识别结果与组合文本表达对应的识别结果作为对应关联关系的抽取结果。本申请中,基于位置信息筛选出与目标文本表达关联的候选文本表达,将目标文本表达与候选文本表达进行文本组合,预测组合后的文本是否存在对应的关联关系,根据对应预测结果进行关系抽取,从而确定与目标文本表达存在关联关系的文本表达,通过两次提取,提高了关系抽取的精度。
本文档来自技高网...【技术保护点】
1.一种基于强化学习的病例关系抽取方法,其特征在于,所述病例关系抽取方法包括:
2.如权利要求1所述的病例关系抽取方法,其特征在于,所述将所述待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在所述待抽取病例图像中的像素位置,包括:
3.如权利要求1所述的病例关系抽取方法,其特征在于,所述对所述文本表达和所述像素位置分别进行特征编码,得到对应文本表达的关键文本特征以及位置标签特征,包括:
4.如权利要求1所述的病例关系抽取方法,其特征在于,所述根据所述目标文本表达对应的位置信息,选取与所述目标文本表达关联的N个候选文本表达,包括:
5.如权利要求1所述的病例关系抽取方法,其特征在于,所述通过预设强化学习分类器,对所述文本表达对进行关联关系预测,得到预测关联结果,包括:
6.如权利要求1所述的病例关系抽取方法,其特征在于,所述将所述目标文本表达对应的识别结果与所述组合文本表达对应的识别结果作为对应关联关系的抽取结果之后,还包括:
7.一种基于强化学习的病例关系抽取装置,其特征在于,所述病例关系抽
8.如权利要求7所述的病例关系抽取装置,其特征在于,所述获取模块包括:
9.一种终端设备,其特征在于,所述终端设备包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的病例关系抽取方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的病例关系抽取方法。
...【技术特征摘要】
1.一种基于强化学习的病例关系抽取方法,其特征在于,所述病例关系抽取方法包括:
2.如权利要求1所述的病例关系抽取方法,其特征在于,所述将所述待抽取病例图像中表征文字的图像区域转换为文本表达,提取每个文本表达在所述待抽取病例图像中的像素位置,包括:
3.如权利要求1所述的病例关系抽取方法,其特征在于,所述对所述文本表达和所述像素位置分别进行特征编码,得到对应文本表达的关键文本特征以及位置标签特征,包括:
4.如权利要求1所述的病例关系抽取方法,其特征在于,所述根据所述目标文本表达对应的位置信息,选取与所述目标文本表达关联的n个候选文本表达,包括:
5.如权利要求1所述的病例关系抽取方法,其特征在于,所述通过预设强化学习分类器,对所述文本表达对进行关联关系预测,得到预测关联结果,包括...
【专利技术属性】
技术研发人员:董永飞,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。