一种表格检测方法、装置、设备以及存储介质制造方法及图纸

技术编号:30766395 阅读:20 留言:0更新日期:2021-11-10 12:26
本公开提供了一种表格检测方法、装置、设备以及存储介质,涉及人工智能技术领域,尤其涉及深度学习、大数据等领域。具体实现方案为:获取待处理图像;将待处理图像输入预先训练好的深度学习模型,通过深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;全表检测分支结果表示针对待处理图像中全表的检测结果,列检测分支结果表示针对待处理图像中表格中列的检测结果,表头检测分支结果表示针对待处理图像中表头的检测结果;基于全表检测分支结果、列检测分支结果和表头检测分支结果,得到待处理图像中表格的检测结果。本公开实施例提供的表格检测方法、装置、设备以及存储介质,能够提高表格检测的准确性。能够提高表格检测的准确性。能够提高表格检测的准确性。

【技术实现步骤摘要】
一种表格检测方法、装置、设备以及存储介质


[0001]本公开涉及人工智能
,尤其涉及深度学习、大数据等领域,具体涉及一种表格检测方法、装置、设备以及存储介质。

技术介绍

[0002]随着带摄像头的移动设备的普及,越来越多的客户通过这些设备拍照上传文件图片,故从文件图片中提取有效信息也成为了一项基本的任务。而表格是日常办公处理文件中的重要内容,在多种应用中,信息经常以表格的形式呈现。因此,在人们的日常生活和工作中常常需要对表格进行检测,以抽取表格中的信息。

技术实现思路

[0003]本公开提供了一种表格检测方法、装置、设备以及存储介质。
[0004]根据本公开的第一方面,提供了一种表格检测方法,可以包括:
[0005]获取待处理图像;
[0006]将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;所述全表检测分支结果表示针对所述待处理图像中全表的检测结果,所述列检测分支结果表示针对所述待处理图像中表格中列的检测结果,所述表头检测分支结果表示针对所述待处理图像中表头的检测结果;
[0007]基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果。
[0008]根据本公开的第二方面,提供了一种表格检测装置,包括:
[0009]第一获取模块,用于获取待处理图像;
[0010]模型处理模块,用于将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;所述全表检测分支结果表示针对所述待处理图像中全表的检测结果,所述列检测分支结果表示针对所述待处理图像中表格中列的检测结果,所述表头检测分支结果表示针对所述待处理图像中表头的检测结果;
[0011]确定模块,用于基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果。
[0012]根据本公开的第三方面,提供了一种电子设备,包括:
[0013]至少一个处理器;以及
[0014]与所述至少一个处理器通信连接的存储器;其中,
[0015]所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行第一方面所述的方法。
[0016]根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据第一方面所述的方法。
[0017]根据本公开的第五方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据第一方面所述的方法。
[0018]本公开实施例中,通过深度学习模型,除了得到全表检测分支结果,还得到列检测分支结果和表头检测分支结果,基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果,如此,能够提高表格检测的准确性。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0021]图1是本公开实施例中表格检测方法的流程图;
[0022]图2是本公开实施例中基于全表检测分支结果、列检测分支结果和表头检测分支结果,得到待处理图像中表格的检测结果的流程图;
[0023]图3是本公开实施例中通过深度学习模型输出三个分支结果的示意图;
[0024]图4是本公开实施例提供的表格检测的结果示意图;
[0025]图5是本公开实施例提供的训练得到深度学习模型的流程图;
[0026]图6是根据本公开实施例提供的表格检测装置的结构示意图;
[0027]图7是根据本公开实施例提供的表格检测装置的另一种结构示意图;
[0028]图8是用来实现本公开实施例的表格检测方法的电子设备的框图。
具体实施方式
[0029]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0030]相关技术中表格检测方式一般都是针对标准表格进行检测,例如,针对有明确边界线的表格,通过检测边界线以实现对表格的检测。但是,一些表格中有可能没有明确的边界线,可以理解为非规范表格,医疗明细类票据版式繁杂且同版式间变化大,给表格检测增加了难度,则相关技术中的这种针对标准表格的检测方式则无法完成对非规范表格进行检测。且实际数据中往往存在多栏表格及倾斜和褶皱等问题,导致通用的表格检测方式在明细类数据中效果不佳。
[0031]医疗明细占据医疗报销票据中很重要的部分,其中重要的部分是表格形式的文字结构。表格用于以结构化方式呈现基本信息,其中表格检测是表格信息抽取的关键步骤。在实际业务场景下,通常只拿到明细票据的纸质版或者用户上传的图像数据。如何从这些纸质文档或文档照片中提取出能够结构化存储的关键信息,从而将这些文档电子化,涉及到了大量图像文本识别的相关技术,例如文字检测、结构化解析、端到端文字检测识别、表格提取等等。
[0032]本公开实施例提出了一种并行多分支表格检测方法,使用卷积神经网络根据图像特征学习像素级别的类别信息,分别预测全图的范围、表格列的范围以及表头行的范围,通
过表格列的信息和表格表头的位置信息强化表格范围的检测,显著提高了表格图像内容解析的准确性和可用性。
[0033]本公开实施例提供了一种明细类的表格区检测的方式,能够提高表格检测的准确率,是后续基于检测的表格进行信息抽取的重要基础。且提供了一种针对非规范表格的可行的检测方式,即可以实现对非规范表格如医疗明细票据等的检测。
[0034]本公开实施例提供的表格检测方法通过并行检测表头、表列以及全表,利用表结构的先验信息辅助表格的检测,在进行全表检测的同时实现表头行的抽取以及表格列的抽取。此外本公开实施例中考虑表格结构先验知识,即利用多个样本图像训练深度学习模型,以使深度学习模型学习表格的结构信息,避免在表格检测的场景中导致漏检或者过检的问题。且针对自然场景中医疗明细类票据的表格检测方案,加入了表格的结构信息,有效针对明细类票据存在版式复杂等问题。
[0035]下面对本公开实施例提供的表格检测方法进行详细说明。
[0036]本公开实施例提供表格检测方法可以应用于电子设备,例如,服务器、终端,等等。
[0037]本专利技术实施例提供了一种表格检测方法,如图1所示,可以包括:
[0038]S101,获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种表格检测方法,包括:获取待处理图像;将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;所述全表检测分支结果表示针对所述待处理图像中全表的检测结果,所述列检测分支结果表示针对所述待处理图像中表格中列的检测结果,所述表头检测分支结果表示针对所述待处理图像中表头的检测结果;基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果。2.根据权利要求1所述的方法,其中,所述基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果,包括:对所述全表检测分支结果、列检测分支结果和表头检测分支结果进行叠加;对叠加得到的结果拟合边界范围,得到所述待处理图像中针对表格的检测框。3.根据权利要求2所述的方法,其中,所述全表检测分支结果包括全表检测分支二值图,所述全表检测分支二值图表示所述待处理图像中各个像素点是否属于全表;所述列检测分支结果包括列检测分支二值图,所述列检测分支二值图表示所述待处理图像中各个像素点是否属于表格中的列;所述表头检测分支结果包括表头检测分支二值图,所述表头检测分支二值图表示所述待处理图像中各个像素点是否属于表头;所述对所述全表检测分支结果、列检测分支结果和表头检测分支结果进行叠加,包括:对所述全表检测分支二值图、所述列检测分支二值图和所述表头检测分支二值图求取并集,得到并集二值图;所述对叠加得到的结果拟合边界范围,得到所述待处理图像中针对表格的检测框,包括:确定所述并集二值图中的连通区域;确定所述连通区域的外接矩形,所述外接矩形为所述待处理图像中针对表格的检测框。4.根据权利要求1至3任一项所述的方法,所述方法还包括:获取多个样本图像以及各个样本图像中标注的表格的全表、标注的列和标注的表头;针对各个样本图像,将所述样本图像输入初始模型;通过所述初始模型对所述样本图像进行特征提取;将特征提取的结果分别输入全表检测分支、列检测分支和表头检测分支,得到样本全表检测分支结果、样本列检测分支结果和样本表头检测分支结果;利用所述样本全表检测分支结果、所述样本列检测分支结果和所述样本表头检测分支结果,以及标注的表格的全表、标注的列和标注的表头对所述初始模型进行训练,得到深度学习模型。5.根据权利要求4所述的方法,其中,所述利用所述样本全表检测分支结果、所述样本列检测分支结果和所述样本表头检测分支结果,以及标注的表格的全表、标注的列和标注的表头对所述初始模型进行训练,得到深度学习模型,包括:利用所述样本全表检测分支结果和所述标注的表格的全表,通过第一损失函数,计算第一损失函数值;
利用所述样本列检测分支结果和所述标注的列,通过第二损失函数,计算第二损失函数值;利用所述样本表头检测分支结果和所述标注的表头,通过第三损失函数,计算第三损失函数值;将所述第一损失函数值、所述第二损失函数值和所述第三损失函数值求和,得到总函数值;基于所述总函数值对所述初始模型进行训练,得到深度学习模型。6.一种表格检测装置,包括:第一获取模块,用于获取待处理图像;模型处理模块,用于将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检...

【专利技术属性】
技术研发人员:周侠王乐义李乔伊秦铎浩刘明浩
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1