表格图片的处理方法、系统、可读存储介质及计算机设备技术方案

技术编号:26223172 阅读:26 留言:0更新日期:2020-11-04 10:54
本发明专利技术公开了一种表格图片的处理方法、系统、可读存储介质及计算机设备,所述方法包括:根据原始表格图片获取每个单元格的位置信息,所述位置信息包括所述单元格的四个顶点位置;判断当前单元格的任一非顶点位置与相邻单元格的任一顶点位置是否重合;若是,则判定所述当前单元格为合并单元格,在当前单元格的相邻位置插入单元格;通过获取每个单元格的四个顶点位置作为位置信息,并根据所述位置信息为参考插入新的单元格;通过本发明专利技术的方案,不需要生成表格点,从而避免了表格点因参数设置缺失,处理表格点时可能导致无法插入单元格的问题。

【技术实现步骤摘要】
表格图片的处理方法、系统、可读存储介质及计算机设备
本专利技术涉及数据处理
,特别是涉及表格图片的处理方法、系统、可读存储介质及计算机设备。
技术介绍
日常工作中,经常需要将含有表格的文件电子化,以对表格内容进行操作、编辑,比如纸质财务报表的电子化处理,通常使用终端设备对财务报表进行拍照,或通过扫描设备对纸质财务报表进行扫描,利用图像识别技术将文件电子化。而现有的含表格图片电子化后,其表格内容依旧是不可编辑的,还需将其转化为可编辑的表格格式(如Excel格式),首先将表格图片按合并单元格分割成合并单元格图片,使用图片文字识别技术识别其中的文字内容,再还原各合并单元格至表格中的初始位置,最后写入合并单元格对应的文字内容,完成不可编辑的表格图片内容转为可编辑的表格内容。常见表格分割及还原方法为:首先生成表格点,单元格顶点位置附近可能存在多个表格点,对位置附近的表格点归一,只保留一个表格点,然后通过表格点之间的相对位置,对单元格进行分割并保存各单元格的相对位置,再通过单元格的相对位置信息对其还原。此方法存在以下问题:一是表格线可能扭曲或倾斜或行之间间隙过小,计算表格点相对位置时容易出错,导致无法分割;二是生成表格点时因参数设置原因(图片质量千差万别,很难用某固定参数适用所有情况),导致某些单元格位置上表格点缺失;而出现合并单元格时,其也表现出表格点缺失的现象,因此无法判断表格点缺失是因参数设置导致还是存在合并单元格导致。基于以上缺陷,该方法只能适用于表格线较平直且无合并单元格情况。
技术实现思路
本专利技术的目的在于提出一种表格图片的处理方法,以解决现有的表格分割方法只适用于表格线较平直且无合并单元格的情况。一种表格图片的处理方法,其特征在于,所述方法包括:根据原始表格图片获取每个单元格的位置信息,所述位置信息包括所述单元格的四个顶点位置;判断当前单元格的任一非顶点位置与相邻单元格的任一顶点位置是否重合;若是,则判定所述当前单元格为合并单元格,在当前单元格的相邻位置插入单元格。根据本专利技术提出的表格图片的处理方法,通过获取每个单元格的四个顶点位置作为单元格的位置信息,对相邻的单元格位置信息判断是否为合并单元格,并对所有的合并单元格的相邻位置插入新的单元格进行分割;通过本专利技术的方案,不需要生成表格点,从而避免了表格点因参数设置缺失,处理表格点时可能导致无法分割单元格的问题。另外,根据本专利技术提供的表格图片的处理方法,还可以具有如下附加的技术特征:进一步地,所述获取每个单元格的位置信息的具体步骤包括:将所述原始表格图片二值化去噪处理;通过膨胀和腐蚀方法识别表格线,获取只含表格线信息的处理图片;获取所述处理图片中的每个单元格的封闭轮廓的所述四个顶点位置;根据所述单元格所述四个顶点位置去除不符合单元格长度或宽度的轮廓。进一步地,所述判断当前单元格的任一非顶点位置与相邻单元格的任一顶点位置是否重合的步骤具体包括:根据第一行第一列的单元格的所述位置信息为起点,按行的顺序由上至下分别判断每一行的每个单元格是否为合并单元格;若当前单元格的右侧的顶点位置的距离与所述处理图片的表格线信息宽度一致,则转移至下一行进行判断。进一步地,所述判定所述当前单元格为合并单元格,在当前单元格的相邻位置插入单元格的步骤包括:将第N行的单元格数量减去第N-1行单元格的数量,得到差值X,其中,N为大于1的正整数;当差值X小于0时,将所述第N行的单元格数量增加为与所述第N-1行的单元格数量一致;当差值X大于0时,将所述第N-1行与所述第N-1行之前的所有行的单元格数量增加为与所述第N行的单元格数量一致。进一步地,所述处理方法还包括:当差值X为0时,将之前已插入的单元格合并还原。进一步地,所述插入单元格后合并还原的步骤具体包括:在插入所述单元格时,将插入得到的单元格的内容标记为空。进一步地,所述插入单元格后合并还原的步骤还包括:在插入所述合并单元格时,将插入得到的插入单元格赋予方向信息,所述方向信息包括所述插入单元格与相邻单元格合并还原形成所述合并单元格的方向。本专利技术提出一种表格的处理系统,所述系统包括:获取模块,用于获取每个单元格的位置信息,所述位置信息包括所述单元格的四个顶点位置;判断模块,用于判断当前单元格的任意非顶点位置与相邻单元格的任一顶点位置是否重合;插入模块,用于判定所述当前单元格为合并单元格后,在当前单元格的相邻位置插入单元格。根据本专利技术提出的表格的处理系统,通过获取每个单元格的四个顶点位置作为单元格的位置信息,对相邻的单元格位置信息判断是否为合并单元格,在判断为合并单元格的相邻位置插入新的单元格;通过本专利技术的方案,不需要生成表格点,从而避免了表格点因参数设置缺失,处理表格点时可能导致无法插入单元格的问题。进一步地,所述获取模块还包括:处理单元,用于将所述原始表格图片二值化去噪处理,并通过膨胀和腐蚀方法识别表格线,获取只含表格线信息的处理图片;获取单元,用于获取所述处理图片中的每个单元格的封闭轮廓的所述四个顶点位置,并根据所述单元格四个顶点位置去除不符合单元格长度或宽度的轮廓。进一步地,所述判断模块包括:顺序单元,用于根据第一行第一列的单元格的所述位置信息为起点,按行的顺序由上至下分别判断每一行的每个单元格是否为合并单元格;若当前单元格的右侧的顶点位置的距离与所述处理图片的表格线信息宽度一致,则转移至下一行进行判断。进一步地,所述插入模块包括:执行单元,用于将第N行的单元格数量减去第N-1行单元格的数量,得到差值X,其中,N为大于1的正整数;当差值X小于0时,将所述第N行的单元格数量增加为与所述第N-1行的单元格数量一致;当差值X大于0时,将所述第N-1行与所述第N-1行之前的所有行的单元格数量增加为与所述第N行的单元格数量一致。进一步地,所述系统还包括还原模块,所述还原模块用于当差值X为0时,将之前已插入的单元格合并还原。进一步地,所述还原模块还包括:内容标记单元,用于在插入所述单元格时,将插入得到的单元格的内容标记为空;方向标记单元,用于在插入所述单元格时,将插入得到的单元格赋予方向信息,所述方向信息包括所述单元格与相邻单元格合并还原形成所述合并单元格的方向。本专利技术还提出一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如上述的表格图片的处理方法。本专利技术还提出一种计算机设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如上述的表格图片的处理方法。本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术的上述和/或附加的方面和本文档来自技高网...

【技术保护点】
1.一种表格图片的处理方法,其特征在于,所述方法包括:/n根据原始表格图片获取每个单元格的位置信息,所述位置信息包括所述单元格的四个顶点位置;/n判断当前单元格的任一非顶点位置与相邻单元格的任一顶点位置是否重合;/n若是,则判定所述当前单元格为合并单元格,在当前单元格的相邻位置插入单元格。/n

【技术特征摘要】
1.一种表格图片的处理方法,其特征在于,所述方法包括:
根据原始表格图片获取每个单元格的位置信息,所述位置信息包括所述单元格的四个顶点位置;
判断当前单元格的任一非顶点位置与相邻单元格的任一顶点位置是否重合;
若是,则判定所述当前单元格为合并单元格,在当前单元格的相邻位置插入单元格。


2.根据权利要求1所述的表格图片的处理方法,其特征在于,所述获取每个单元格的位置信息的具体步骤包括:
将所述原始表格图片二值化去噪处理;
通过膨胀和腐蚀方法识别表格线,获取只含表格线信息的处理图片;
获取所述处理图片中的每个单元格的封闭轮廓的所述四个顶点位置;
根据所述单元格所述四个顶点位置去除不符合单元格长度或宽度的轮廓。


3.根据权利要求2所述的表格图片的处理方法,其特征在于,所述判断当前单元格的任一非顶点位置与相邻单元格的任一顶点位置是否重合的步骤具体包括:
根据第一行第一列的单元格的所述位置信息为起点,按行的顺序由上至下分别判断每一行的每个单元格是否为合并单元格;
若当前单元格的右侧的顶点位置的距离与所述处理图片的表格线信息宽度一致,则转移至下一行进行判断。


4.根据权利要求3所述的表格图片的处理方法,其特征在于,所述判定所述当前单元格为合并单元格,在当前单元格的相邻位置插入单元格的步骤包括:
将第N行的单元格数量减去第N-1行单元格的数量,得到差值X,其中,N为大于1的正整数;
当差值X小于0时,将所述第N行的单元格数量增加为与所述第N-1行的单元格数量一...

【专利技术属性】
技术研发人员:甘宇张雷王君夏志超李振刚刘斯凡袁海光
申请(专利权)人:江西汉辰信息技术股份有限公司深圳京发科技控股有限公司
类型:发明
国别省市:江西;36

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1