【技术实现步骤摘要】
一种表格提取方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,进一步涉及自动识别技术,尤其是一种表格提取方法、装置、电子设备及存储介质。
技术介绍
[0002]在对表格图片进行光学字符识别(Optical Character Recognition,简称OCR)时,经常会面临一个影响表格提取的因素,就是因拍照角度导致的图片扭曲或者歪斜。拍照件和扫描件的不同就在于,扫描件的结果基本上是一个方方正正的图像,而拍照件尤其是现在常用手机拍照,因为位置和角度的关系,导致表格图片难以是一个方方正正的表格,经常会出现梯形样式的表格,这样普通的歪斜难以进行矫正,即使进行旋转,因本身就是梯形表格,单纯的旋转是没有用的。
[0003]在对这种因拍照角度导致其中表格行列坐标无法对齐的图片进行处理时,相关技术大部分都是需要先对表格图片进行矫正,然后再对校正后的表格图片中的表格进行行列对齐。但是对表格图片进行矫正需要先获取到原始图像,然而在某些业务场景下可能无法获取到原始图像信息,因此无法对表格图片进行矫正,从而无法在表格图片中提取出表格。
技术实现思路
[0004]本公开提供了一种表格提取方法、装置、电子设备以及存储介质。
[0005]第一方面,本公开提供了一种表格提取方法,所述方法包括:
[0006]对表格图片进行光学字符识别,得到所述表格图片的光学字符识别结果;其中,所述光学字符识别结果包括:所述表格图片中的至少一个文字块的内容以及所述至少一个文字块中各个文字块的坐标; />[0007]基于所述表格图片的光学字符识别结果,对所述表格图片进行结构化处理,得到所述表格图片的结构化处理结果;
[0008]基于所述表格图片的结构化处理结果,提取出所述表格图片中的表格。
[0009]第二方面,本公开提供了一种表格提取装置,所述装置包括:识别模块、结构化处理模块和提取模块;其中,
[0010]所述识别模块,用于对表格图片进行光学字符识别,得到所述表格图片的光学字符识别结果;其中,所述光学字符识别结果包括:所述表格图片中的至少一个文字块的内容以及所述至少一个文字块中各个文字块的坐标;
[0011]所述结构化处理模块,用于基于所述表格图片的光学字符识别结果,对所述表格图片进行结构化处理,得到所述表格图片的结构化处理结果;
[0012]所述提取模块,用于基于所述表格图片的结构化处理结果,提取出所述表格图片中的表格。
[0013]第三方面,本公开实施例提供了一种电子设备,包括:
[0014]一个或多个处理器;
[0015]存储器,用于存储一个或多个程序,
[0016]当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本公开任意实施例所述的表格提取方法。
[0017]第四方面,本公开实施例提供了一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现本公开任意实施例所述的表格提取方法。
[0018]第五方面,提供了一种计算机程序产品,当所述计算机程序产品被计算机设备执行时实现本公开任意实施例所述的表格提取方法。
[0019]根据本公开的技术解决了在某些业务场景下可能无法获取到原始图像,无法对表格图片进行矫正,从而无法在表格图片中提取出表格的技术问题,本公开提供的技术方案,可以在扭曲或者歪斜的图片中提取出表格,无需获取原始图像,同时还可以提升表格结构化的效果。
[0020]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0021]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0022]图1是本公开实施例提供的表格提取方法的第一流程示意图;
[0023]图2是本公开实施例提供的表格提取方法的第二流程示意图;
[0024]图3是本公开实施例提供的表格提取方法的第三流程示意图;
[0025]图4是本公开实施例提供的表格提取装置的结构示意图;
[0026]图5是用来实现本公开实施例的表格提取方法的电子设备的框图。
具体实施方式
[0027]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]实施例一
[0029]图1是本公开实施例提供的表格提取方法的流程示意图,该方法可以由表格提取装置或者电子设备来执行,该装置或者电子设备可以由软件和/或硬件的方式实现,该装置或者电子设备可以集成在任何具有网络通信功能的智能设备中。如图1所示,表格提取方法可以包括以下步骤:
[0030]S101、对表格图片进行光学字符识别,得到表格图片的光学字符识别结果;其中,光学字符识别结果包括:表格图片中的至少一个文字块的内容以及该至少一个文字块中各个文字块的坐标。
[0031]在本步骤中,电子设备可以对表格图片进行光学字符识别,得到表格图片的光学字符识别结果;其中,光学字符识别结果包括:表格图片中的至少一个文字块的内容以及该至少一个文字块中各个文字块的坐标。可选地,各个文字块的坐标可以包括:各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标;其中,四个顶点包括:左上角顶点、左
下角顶点、右上角顶点和右下角顶点。
[0032]S102、基于表格图片的光学字符识别结果,对表格图片进行结构化处理,得到表格图片的结构化处理结果。
[0033]在本步骤中,电子设备可以基于表格图片的光学字符识别结果,对表格图片进行结构化处理,得到表格图片的结构化处理结果。可选地,电子设备可以先提取出各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标;其中,四个顶点包括:左上角顶点、左下角顶点、右上角顶点和右下角顶点;然后基于各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标,将表格图片中的表格进行列对齐处理,得到表格图片的列对齐处理结果;再基于表格图片的列对齐处理结果,对表格图片中的表格进行行对齐处理,得到表格图片的行对齐处理结果;并将表格图片的行对齐处理结果作为表格图片的结构化处理结果。
[0034]S103、基于表格图片的结构化处理结果,提取出表格图片中的表格。
[0035]在本步骤中,电子设备可以基于表格图片的结构化处理结果,提取出表格图片中的表格。可选地,电子设备可以在结构化处理结果依次提取出每一列和每一行,并将提取出的每一列进行列对齐处理,将提取出的每一行进行行对齐处理,从而得到表格图片中的表格。
[0036]本公开实施例提出的表格提取方法,先对表格图片进行光学字符识别,得到表格图片的光学字符识别结果;然后本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种表格提取方法,所述方法包括:对表格图片进行光学字符识别,得到所述表格图片的光学字符识别结果;其中,所述光学字符识别结果包括:所述表格图片中的至少一个文字块的内容以及所述至少一个文字块中各个文字块的坐标;基于所述表格图片的光学字符识别结果,对所述表格图片进行结构化处理,得到所述表格图片的结构化处理结果;基于所述表格图片的结构化处理结果,提取出所述表格图片中的表格。2.根据权利要求1所述的方法,其中,所述基于所述表格图片的光学字符识别结果,对所述表格图片进行结构化处理,得到所述表格图片的结构化处理结果,包括:提取出各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标;其中,所述四个顶点包括:左上角顶点、左下角顶点、右上角顶点和右下角顶点;基于各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标,将所述表格图片中的表格进行列对齐处理,得到所述表格图片的列对齐处理结果;基于所述表格图片的列对齐处理结果,对所述表格图片中的表格进行行对齐处理,得到所述表格图片的行对齐处理结果,并将所述表格图片的行对齐处理结果作为所述表格图片的结构化处理结果。3.根据权利要求2所述的方法,其中,所述基于各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标,将所述表格图片中的表格进行列对齐处理,得到所述表格图片的列对齐处理结果,包括:基于各个文字块的左上角顶点在X轴方向上的坐标,对全部文字块进行排序,得到全部文字块的排序结果;基于全部文字块的排序结果以及各个文字块的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标,计算全部文字块中每两个文字块在Y轴方向上的重合度;根据全部文字块中每两个文字块在Y轴方向上的重合度,得到各个文字块的左边文本框标识和右边文本框标识;根据各个文字块的左边文本框标识和右边文本框标识,得到所述表格图片的列对齐处理结果。4.根据权利要求3所述的方法,其中,所述根据各个文字块的左边文本框标识和右边文本框标识,得到所述表格图片的列对齐处理结果,包括:在全部文字块中选取其左边文本框标识为空的文字块,作为所述表格图片的左侧表头候选集中的文字块;对所述左侧表头候选集中的各个文字块进行过滤处理,得到所述左侧表头候选集的过滤处理结果;基于所述左侧表头候选集的过滤处理结果以及各个文字块的右边文本框标识,得到所述表格图片的列对齐处理结果。5.根据权利要求4所述的方法,其中,所述基于所述左侧表头候选集的过滤处理结果以及各个文字块的右边文本框标识,得到所述表格图片的列对齐处理结果,包括:将所述左侧表头候选集的过滤处理结果中的各个文字块进行列对齐,作为所述表格图片的第一列的各个文字块;
基于所述表格图片的第一列的各个文字块的右边文本框标识,得到所述表格图片的第二列的各个文字块;基于所述表格图片的第一列的各个文字块和所述表格图片的第二列的各个文字块,得到所述表格图片中的其余各列的各个文字块。6.根据权利要求2所述的方法,其中,所述基于所述表格图片的列对齐处理结果,对所述表格图片中的表格进行行对齐处理,得到所述表格图片的行对齐处理结果,包括:在表头字典中选取匹配于所述表格图片中的表格的表头;基于表头的四个顶点在X轴方向上的坐标和在Y轴方向上的坐标,得到所述表格图片中的表格的每一行的各个文字块;将所述表格图片中的表格的每一行的全部文字块进行对齐处理,得到所述表格图片的行对齐处理结果。7.一种表格提取装置,所述装置包括:识别模块、结构化处理模块和提取模块;其中,所述识别模块,用于对表格图片进...
【专利技术属性】
技术研发人员:韩光耀,许海洋,冯博豪,姜泽青,李治平,陈禹燊,王天祺,方文浩,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。