一种文本内容定位方法、系统、设备及存储介质技术方案

技术编号:35986930 阅读:20 留言:0更新日期:2022-12-17 23:00
本发明专利技术公开了一种文本内容定位方法、系统、设备及存储介质,其中,方法包括:获取待定位文本;对所述待定位文本进行图像转换处理,确定文本图像;对所述待定位文本进行坐标信息获取处理,确定文本坐标信息;将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息;将所述图表坐标信息与所述文本坐标信息进行坐标映射处理,确定目标定位文本内容;本发明专利技术实施例能够准确地定位文本内容,可广泛应用于目标检测技术领域。可广泛应用于目标检测技术领域。可广泛应用于目标检测技术领域。

【技术实现步骤摘要】
一种文本内容定位方法、系统、设备及存储介质


[0001]本专利技术涉及目标检测
,尤其是一种文本内容定位方法、系统、设备及存储介质。

技术介绍

[0002]在医疗器械说明书及临床文献中,存在着大量文字、表格和图文组成的关键数据信息,这些数据对于医疗器械行业的研究机构来说价值非常大。但是这些数据在临床文献和产品说明书中,通常存在两栏式和一栏式混排的文本布局、图片表格的形状和位置不定、表格内无明显分界线等特点。使用相关的文本定位技术,难以将这些非格式化的文本、表格等内容进行详细精准的定位,从而更好地利用这些数据。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供一种文本内容定位方法、系统、设备及存储介质,以实现准确定位文本内容。
[0004]一方面,本专利技术提供了一种文本内容定位方法,包括:
[0005]获取待定位文本;
[0006]对所述待定位文本进行图像转换处理,确定文本图像;
[0007]对所述待定位文本进行坐标信息获取处理,确定文本坐标信息;
[0008]将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息;
[0009]将所述图表坐标信息与所述文本坐标信息进行坐标映射处理,确定目标定位文本内容。
[0010]可选地,在所述获取待定位文本之前,包括:
[0011]获取待处理文本;
[0012]对所述待处理文本进行文字识别转换处理,确定待定位文本。
[0013]可选地,所述对所述待定位文本进行图像转换处理,确定文本图像,包括:
[0014]对所述待定位文本进行图像格式转换,确定文本图像,所述文本图像的图像大小与所述待定位文本的页面大小相同。
[0015]可选地,所述对所述待定位文本进行坐标信息获取处理,确定文本坐标信息,包括:
[0016]根据文本信息提取库对所述待定位文本的每个字符的坐标信息进行获取,确定文本坐标信息,所述文本坐标信息包括所述待定位文本中所有字符的坐标信息。
[0017]可选地,在所述将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息之前,包括:
[0018]获取训练数据集;
[0019]通过注解脚本对所述训练数据集进行标注处理,确定索引文件;
[0020]将所述索引文件输入训练脚本进行模型训练,确定权重文件;
[0021]将所述权重文件输入待训练模型进行参数更新处理,确定训练好的图表目标检测定位模型。
[0022]可选地,所述将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息,包括:
[0023]根据所述图表目标检测定位模型对所述文本图像进行图片检测,得到图标坐标信息,所述图表坐标信息包括图表目标的目标置信度及矩形对角坐标信息。
[0024]可选地,所述将所述图表坐标信息与所述文本坐标信息进行坐标映射处理,确定目标定位文本内容,包括:
[0025]根据所述图表坐标信息,确定图表坐标区域;
[0026]根据所述文本坐标信息,确定所述图表坐标区域以外的坐标区域为目标定位文本内容。
[0027]另一方面,本专利技术实施例还公开了一种文本内容定位系统,包括:
[0028]第一模块,用于获取待定位文本;
[0029]第二模块,用于对所述待定位文本进行图像转换处理,确定文本图像;
[0030]第三模块,用于对所述待定位文本进行坐标信息获取处理,确定文本坐标信息;
[0031]第四模块,用于将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息;
[0032]第五模块,用于将所述图表坐标信息与所述文本坐标信息进行坐标映射处理,确定目标定位文本内容。
[0033]另一方面,本专利技术实施例还公开了一种电子设备,包括处理器以及存储器;
[0034]所述存储器用于存储程序;
[0035]所述处理器执行所述程序实现如前面所述的方法。
[0036]另一方面,本专利技术实施例还公开了一种计算机可读存储介质,所述存储介质存储有程序,所述程序被处理器执行实现如前面所述的方法。
[0037]另一方面,本专利技术实施例还公开了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器可以从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行前面的方法。
[0038]本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术实施例通过获取待定位文本;对所述待定位文本进行图像转换处理,确定文本图像;能够通过转换为文本图像从而减少了待定位文本中表格和图片对目标检测的影响;另外,本专利技术实施例通过对所述待定位文本进行坐标信息获取处理,确定文本坐标信息;将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息;能够通过图表目标检测定位模型对图表进行准确的检测和定位;再者,本专利技术实施例将所述图表坐标信息与所述文本坐标信息进行坐标映射处理,确定目标定位文本内容,能够确认出待定位文本中的图表位置,从而间接定位得到待定位文本内容,提高了内容定位的准确度。
附图说明
[0039]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使
用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0040]图1为本专利技术实施例的一种文本内容定位方法流程图。
具体实施方式
[0041]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0042]目前较常见的文本定位算法如文本边缘检测(如canny、sobel、laplacian、prewitt法)、非极大值抑制(NMS)、最大稳定极值区域(MSER)和角点检测(如Harris、moravec、Forstner法)等都属于对文本信息所在区域进行直接定位的方法。上述列举的4种算法其对目标的识别主要是通过对图片进行二值化处理后再做图像边缘检测,但是一些特殊的文本处理对象(如临床文献和产品说明书等)中常存在三线式表格和边缘不完整的图片(如各种统计图),若直接进行文本边缘检测容易误定位到在表格中的数据。而且若应用于图表的识别上也存在以下局限性:文献中图表的形状在阅读过程中常只需被认为是一个矩形的“块”即可,对边缘的形状要求不需要非常精确。若采取上述列举的算法,对不规则图案形状进行定位得到的坐标数据可能会非常琐碎和繁多,并需要进一步设定复杂的计算规则来还原出该图案所在的大致范围,在准确度方面不容易达到很高;对三线表进行边缘的定位之后也需要较复杂的条件判断将检测出的线条进行组合来还原出一个三线本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文本内容定位方法,其特征在于,包括:获取待定位文本;对所述待定位文本进行图像转换处理,确定文本图像;对所述待定位文本进行坐标信息获取处理,确定文本坐标信息;将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息;将所述图表坐标信息与所述文本坐标信息进行坐标映射处理,确定目标定位文本内容。2.根据权利要求1所述的一种文本内容定位方法,其特征在于,在所述获取待定位文本之前,包括:获取待处理文本;对所述待处理文本进行文字识别转换处理,确定待定位文本。3.根据权利要求1所述的一种文本内容定位方法,其特征在于,所述对所述待定位文本进行图像转换处理,确定文本图像,包括:对所述待定位文本进行图像格式转换,确定文本图像,所述文本图像的图像大小与所述待定位文本的页面大小相同。4.根据权利要求1所述的一种文本内容定位方法,其特征在于,所述对所述待定位文本进行坐标信息获取处理,确定文本坐标信息,包括:根据文本信息提取库对所述待定位文本的每个字符的坐标信息进行获取,确定文本坐标信息,所述文本坐标信息包括所述待定位文本中所有字符的坐标信息。5.根据权利要求1所述的一种文本内容定位方法,其特征在于,在所述将所述文本图像输入预先训练好的图表目标检测定位模型,得到图表坐标信息之前,包括:获取训练数据集;通过注解脚本对所述训练数据集进行标注处理,确定索引文件;将所述索引文件输入训练脚本进行模型训练,确定权重文件;将所述权重文件输入待训练模型进行参数更新处理,确定训练好的图...

【专利技术属性】
技术研发人员:余戈磊郑珂
申请(专利权)人:广州众成大数据科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1