【技术实现步骤摘要】
一种表格检测方法、装置、设备以及存储介质
[0001]本公开涉及人工智能
,尤其涉及深度学习、大数据等领域,具体涉及一种表格检测方法、装置、设备以及存储介质。
技术介绍
[0002]随着带摄像头的移动设备的普及,越来越多的客户通过这些设备拍照上传文件图片,故从文件图片中提取有效信息也成为了一项基本的任务。而表格是日常办公处理文件中的重要内容,在多种应用中,信息经常以表格的形式呈现。因此,在人们的日常生活和工作中常常需要对表格进行检测,以抽取表格中的信息。
技术实现思路
[0003]本公开提供了一种表格检测方法、装置、设备以及存储介质。
[0004]根据本公开的第一方面,提供了一种表格检测方法,可以包括:
[0005]获取待处理图像;
[0006]将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;所述全表检测分支结果表示针对所述待处理图像中全表的检测结果,所述列检测分支结果表示针对所述待处理图像中表格中列的检测结果,所述表头检测分支结果表示针对所述待处理图像中表头的检测结果;
[0007]基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果。
[0008]根据本公开的第二方面,提供了一种表格检测装置,包括:
[0009]第一获取模块,用于获取待处理图像;
[0010]模型处理模块,用于将所述待处理图像输入预先训练好的深度学习模型, ...
【技术保护点】
【技术特征摘要】
1.一种表格检测方法,包括:获取待处理图像;将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检测分支结果和表头检测分支结果;所述全表检测分支结果表示针对所述待处理图像中全表的检测结果,所述列检测分支结果表示针对所述待处理图像中表格中列的检测结果,所述表头检测分支结果表示针对所述待处理图像中表头的检测结果;基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果。2.根据权利要求1所述的方法,其中,所述基于所述全表检测分支结果、列检测分支结果和表头检测分支结果,得到所述待处理图像中表格的检测结果,包括:对所述全表检测分支结果、列检测分支结果和表头检测分支结果进行叠加;对叠加得到的结果拟合边界范围,得到所述待处理图像中针对表格的检测框。3.根据权利要求2所述的方法,其中,所述全表检测分支结果包括全表检测分支二值图,所述全表检测分支二值图表示所述待处理图像中各个像素点是否属于全表;所述列检测分支结果包括列检测分支二值图,所述列检测分支二值图表示所述待处理图像中各个像素点是否属于表格中的列;所述表头检测分支结果包括表头检测分支二值图,所述表头检测分支二值图表示所述待处理图像中各个像素点是否属于表头;所述对所述全表检测分支结果、列检测分支结果和表头检测分支结果进行叠加,包括:对所述全表检测分支二值图、所述列检测分支二值图和所述表头检测分支二值图求取并集,得到并集二值图;所述对叠加得到的结果拟合边界范围,得到所述待处理图像中针对表格的检测框,包括:确定所述并集二值图中的连通区域;确定所述连通区域的外接矩形,所述外接矩形为所述待处理图像中针对表格的检测框。4.根据权利要求1至3任一项所述的方法,所述方法还包括:获取多个样本图像以及各个样本图像中标注的表格的全表、标注的列和标注的表头;针对各个样本图像,将所述样本图像输入初始模型;通过所述初始模型对所述样本图像进行特征提取;将特征提取的结果分别输入全表检测分支、列检测分支和表头检测分支,得到样本全表检测分支结果、样本列检测分支结果和样本表头检测分支结果;利用所述样本全表检测分支结果、所述样本列检测分支结果和所述样本表头检测分支结果,以及标注的表格的全表、标注的列和标注的表头对所述初始模型进行训练,得到深度学习模型。5.根据权利要求4所述的方法,其中,所述利用所述样本全表检测分支结果、所述样本列检测分支结果和所述样本表头检测分支结果,以及标注的表格的全表、标注的列和标注的表头对所述初始模型进行训练,得到深度学习模型,包括:利用所述样本全表检测分支结果和所述标注的表格的全表,通过第一损失函数,计算第一损失函数值;
利用所述样本列检测分支结果和所述标注的列,通过第二损失函数,计算第二损失函数值;利用所述样本表头检测分支结果和所述标注的表头,通过第三损失函数,计算第三损失函数值;将所述第一损失函数值、所述第二损失函数值和所述第三损失函数值求和,得到总函数值;基于所述总函数值对所述初始模型进行训练,得到深度学习模型。6.一种表格检测装置,包括:第一获取模块,用于获取待处理图像;模型处理模块,用于将所述待处理图像输入预先训练好的深度学习模型,通过所述深度学习模型输出全表检测分支结果、列检...
【专利技术属性】
技术研发人员:周侠,王乐义,李乔伊,秦铎浩,刘明浩,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。