一种三线表格的内容识别方法、装置及电子设备制造方法及图纸

技术编号:35699291 阅读:10 留言:0更新日期:2022-11-23 14:52
本申请提供了一种三线表格的内容识别方法、装置及电子设备;所述方法包括:识别图像中的三线表格;对所述三线表格进行文本检测,得到文本检测框的位置以及所述文本检测框的文字识别结果,所述文本检测框的位置与所述文本检测框的文字识别结果一一对应;对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容。本申请提供的基于三线表格的内容识别方法可以提高三线表格内容的识别的效率和准确率。效率和准确率。效率和准确率。

【技术实现步骤摘要】
一种三线表格的内容识别方法、装置及电子设备


[0001]本申请涉及数据处理
,尤其涉及一种三线表格的内容识别方法、装置及电子设备。

技术介绍

[0002]目前,为了避免人工在审核扫描版PDF(Portable Document Format,可携带文档格式)中的三线表格时,耗时较长且容易出错的问题,通常基于图像处理技术来实现三线表格的内容识别。但是现有技术中,大多数识别三线表格的方法通用性不强,检测某些特殊形状和粗细线条的三线表格效果不佳。因此,如何设计一种通用性强,准确高效地识别三线表格的方法,是本申请研究的关键。

技术实现思路

[0003]本申请实施例提供一种三线表格的内容识别方法、装置及电子设备,可以提高三线表格的内容识别的效率以及准确率。
[0004]本申请实施例的技术方案是这样实现的:
[0005]第一方面,本申请实施例提供一种三线表格的内容识别方法,包括:
[0006]识别图像中的三线表格;
[0007]对所述三线表格进行文本检测,得到文本检测框的位置以及所述文本检测框的文字识别结果,所述文本检测框的位置与所述文本检测框的文字识别结果一一对应;
[0008]对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容。
[0009]在上述方案中,所述识别图像中的三线表格,包括:
[0010]确定图像中满足第一条件的轮廓线;
[0011]将所述轮廓线的端点的纵坐标从小到大排序,若存在连续的三条轮廓线的左端点的横坐标相同,且所述三条轮廓线的右端点的横坐标相同,则基于所述三条轮廓线所在的区域内的竖线,确定所述三条轮廓线所在的区域是否为所述三线表格。
[0012]在上述方案中,所述确定图像中满足第一条件的轮廓线,包括:
[0013]若所述轮廓线的宽高比大于第一阈值,高度大于第二阈值,以及宽度大于第三阈值,则确定所述轮廓线为满足所述第一条件的轮廓线。
[0014]在上述方案中,所述基于所述三条轮廓线所在的区域内的竖线,确定所述三条轮廓线所在的区域是否为所述三线表格,包括:
[0015]若所述竖线的数量小于1,则确定所述三条轮廓线所在的区域为所述三线表格。
[0016]在上述方案中,所述对所述三线表格进行文本检测,得到文本检测框的位置以及所述文本检测框的文字识别结果,包括:
[0017]将所述三线表格中的最上端表格线的颜色配置为所述三线表格的底纹的颜色,将所述三线表格中的最下端表格线的颜色配置为所述三线表格的底纹的颜色,得到处理后的三线表格;
[0018]对所述处理后的三线表格进行文本检测,得到所述文本检测框的位置以及所述文本检测框的文字识别结果。
[0019]在上述方案中,所述对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容,包括:
[0020]将首个文本检测框的文字识别结果确定为所述三线表格中位于第一行的第一列的单元格对应的文本内容;
[0021]遍历除所述首个文本检测框以外的其他文本检测框,基于当前遍历的第N个文本检测框相对于第N

1个文本检测框的坐标位置,依次确定三线表格中每个单元格对应的文本内容。
[0022]在上述方案中,所述遍历除所述首个文本检测框以外的其他文本检测框,基于当前遍历的第N个文本检测框相对于第N

1个文本检测框的坐标位置,依次确定三线表格中每个单元格对应的文本内容,包括:
[0023]若所述第N个文本检测框的纵坐标值与所述第N

1个文本检测框的纵坐标值的差值小于或等于第四阈值,则确定所述第N个文本检测框与所述第N

1个文本检测框位于同一行;
[0024]若所述第N个文本检测框的纵坐标值与所述第N

1个文本检测框的纵坐标值的差值大于所述第四阈值,则确定所述第N个文本检测框为所述第N

1个文本检测框的下一行,将与所述第N

1文本检测框同一行的文本检测框按照横坐标值从小到大进行排序,依次确定所述三线表格中与第N

1个文本检测框的同一行中每一列的文本内容;其中,N≥2。
[0025]第二方面,本申请实施例提供一种三线表格的内容识别装置,所述三线表格的内容识别装置包括:
[0026]三线表格识别模块,用于识别图像中的三线表格;
[0027]文本检测模块,用于对所述三线表格进行文本检测,得到文本检测框的位置以及文本检测框的文字识别结果,所述位置与所述文字识别结果一一对应;
[0028]三线表格内容确定模块,用于对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容。
[0029]第三方面,本申请实施例提供一种电子设备,所述电子设备包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的三线表格的内容识别方法。
[0030]第四方面,本申请实施例提供一种计算机可读存储介质,所述存储介质包括一组计算机可执行指令,当所述指令被执行时用于执行本申请实施例提供的三线表格的内容识别方法。
[0031]本申请实施例提供的三线表格的内容识别方法,获取识别图像中的三线表格;对所述三线表格进行文本检测,得到文本检测框的位置以及所述文本检测框的文字识别结果,所述文本检测框的位置与所述文本检测框的文字识别结果一一对应;对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容。本申请的方法不仅可以准确高效地检测到图像中的三线表格,而且对特殊线条的三线表格也可以准确识别,提高了三线表格识别的通用性;同时,也可以高效、准确地确定三线表格中每个单元格对应的文本
内容。
附图说明
[0032]附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0033]图1是本申请实施例提供的三线表格的内容识别方法的一种可选处理流程示意图;
[0034]图2是本申请实施例提供的三线表格的内容识别方法的识别效果示意图;
[0035]图3是本申请实施例提供的三线表格的内容识别方法的另一种可选工作流程示意图;
[0036]图4是本申请实施例提供的三线表格的内容识别装置的一种可选结构示意图;
[0037]图5是本申请实施例提供的一种可选电子设备示意性框图。
具体实施方式
[0038]为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
[0039]在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种三线表格的内容识别方法,其特征在于,所述方法包括:识别图像中的三线表格;对所述三线表格进行文本检测,得到文本检测框的位置以及所述文本检测框的文字识别结果,所述文本检测框的位置与所述文本检测框的文字识别结果一一对应;对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容。2.根据权利要求1所述的方法,其特征在于,所述识别图像中的三线表格,包括:确定图像中满足第一条件的轮廓线;将所述轮廓线的端点的纵坐标从小到大排序,若存在连续的三条轮廓线的左端点的横坐标相同,且所述三条轮廓线的右端点的横坐标相同,则基于所述三条轮廓线所在的区域内的竖线,确定所述三条轮廓线所在的区域是否为所述三线表格。3.根据权利要求2所述的方法,其特征在于,所述确定图像中满足第一条件的轮廓线,包括:若所述轮廓线的宽高比大于第一阈值,高度大于第二阈值,以及宽度大于第三阈值,则确定所述轮廓线为满足所述第一条件的轮廓线。4.根据权利要求2所述的方法,其特征在于,所述基于所述三条轮廓线所在的区域内的竖线,确定所述三条轮廓线所在的区域是否为所述三线表格,包括:若所述竖线的数量小于1,则确定所述三条轮廓线所在的区域为所述三线表格。5.根据权利要求1所述的方法,其特征在于,所述对所述三线表格进行文本检测,得到文本检测框的位置以及所述文本检测框的文字识别结果,包括:将所述三线表格中的最上端表格线的颜色配置为所述三线表格的底纹的颜色,将所述三线表格中的最下端表格线的颜色配置为所述三线表格的底纹的颜色,得到处理后的三线表格;对所述处理后的三线表格进行文本检测,得到所述文本检测框的位置以及所述文本检测框的文字识别结果。6.根据权利要求1所述的方法,其特征在于,所述对所述文本检测框进行排序,确定所述三线表格中每个单元格对应的文本内容,包括:将首个文本检测框的文字识别结果确定为所述三线表格中位于第一行的第一列的单元格对应的文本内容;遍历除所述首个文本检测框以外的其他文本检测框,基于当前遍历的第N个文本检测框相对于第N

1个文本检测框的坐...

【专利技术属性】
技术研发人员:邵俊刘浩王骏荣钟权张学钢
申请(专利权)人:联宝合肥电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1