本发明专利技术公开了一种表格图像识别编辑方法,包括:获取所述表格图像,所述表格图像上包含有表格;根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。本发明专利技术还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置。本发明专利技术通过采用上述技术方案,能够使用户方便的对表格图像进行文字识别和编辑操作,从而高效简便的对表格图像进行处理。
【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种表格图像识别编辑方法,包括:获取所述表格图像,所述表格图像上包含有表格;根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。本专利技术还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置。本专利技术通过采用上述技术方案,能够使用户方便的对表格图像进行文字识别和编辑操作,从而高效简便的对表格图像进行处理。【专利说明】表格图像识别编辑方法及装置
本专利技术涉及一种图像处理方法,尤其是一种表格图像识别编辑方法。本专利技术还涉及一种图像处理装置,尤其是一种表格图像识别编辑装置。
技术介绍
现在,人们已经越来越多的使用电子文档以取代纸质文档。例如,用户可以用智能手机拍摄纸质文档的图像,然后将图像发送给别人以完成信息的传递。但是,以拍摄或扫描得到的电子文档都是以图片格式进行存储的,因此对于上面的文字是难以进行编辑的。现在,随着OCR技术的发展,已有很多软件可以对这些图像上的文字进行识别,供用户进行文本编辑,但是使用起来确不是很方便,尤其是对于包含有表格的文件,由于表格的多样性,图像中的表格不但不能被识别,有时还能造成文字识别的错误,影响识别率,给用户的使用带来了很大的不便。此外,如果发现表格的填写存在错误,用户对图像进行修改也很麻烦。
技术实现思路
本专利技术所要解决的技术问题是提供一种表格图像识别编辑方法,以及实现这种表格图像识别编辑方法所采用的表格图像识别编辑装置,能够方便的对表格图像进行文字识别和编辑,使用户高效简便的对表格图像进行处理。 为解决上述技术问题,本专利技术表格图像识别编辑方法的技术方案是,包括以下步骤:步骤一,获取所述表格图像,所述表格图像上包含有表格;步骤二,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;步骤三,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。 本专利技术还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置,其技术方案是,基于计算机系统,包括:表格图像获取部件,获取所述表格图像,所述表格图像上包含有表格;划分部件,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;编辑部件,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。 本专利技术通过采用上述技术方案,能够使用户方便的对表格图像进行文字识别和编辑操作,从而高效简便的对表格图像进行处理。 【专利附图】【附图说明】 下面结合附图和实施例对本专利技术作进一步详细的说明: 图1和图2为本专利技术表格图像识别编辑方法实施例的示意图;图3为本专利技术表格图像识别编辑装置的示意图。 【具体实施方式】 本专利技术公开了一种表格图像识别编辑方法,包括以下步骤:步骤一,获取所述表格图像,所述表格图像上包含有表格;步骤二,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;步骤三,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。 如图1和图2所不,用户获取表格图像,获取表格图像的方式可以是拍摄表格图像,也可以是打开包含有表格图像的图片文件。该表格图像上有如图1所示的表格AB⑶。由于拍摄的角度问题,原本矩形的表格会在图像上显示为一个如图1所示的四边形AB⑶。为了还原这种失真,在获取表格图像之后,本专利技术表格图像识别编辑方法还包括对所述表格图像进行图像处理步骤,所述图像处理包括以下两种中的至少一种:1.对表格图像进行拉伸,使得拉伸后的表格的形状为矩形。 2.对表格的线条进行处理,将与水平基准的夹角小于某一预设范围的线条的方向拟合为水平方向,将与垂直基准的夹角小于某一预设范围的线条的方向拟合为垂直方向。 在进行上述图像处理之后,图1中的四边形表格AB⑶就会被调整为图2中的矩形表格AB⑶,并且表格中的线条,例如线条EF和线条GK也被调整为水平方向和垂直方向,从而消除了拍摄对表格形状造成的失真。 根据所述表格的线条,例如线条EF和线条GK,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;如图1和图2所示,表格ABCD被划分为编辑单元AGHE、GBFH, EHKD和HFCK。 然后,对所述编辑单元内的图像进行编辑操作,该编辑操作可以是对所述编辑单元内的图像进行修改、替换等传统的图像编辑操作,也可以是以下几种中的至少一种:1.对所述编辑单元内的文字进行OCR识别,并对识别得到的文本进行文本编辑操作,例如,图1的编辑单元EHKD中有手写体的“文字2”,对该编辑单元的文字进行OCR识别,得到如图2中编辑单元EHKC中的印刷体的“文字2”,如果识别结果有误,用户可以进行手动修改。 2.将没有包含文字的编辑单元作为文字编辑区域,由用户在所述文字编辑区域中进行文本编辑操作,例如在图1和图2的编辑单元GBHl中,由用户在其中进行文本编辑操作。 3.调整一根或多根所述表格的线条的位置,以被调整的线条为边界的编辑单元根据该线条的新位置而重新划分区域,例如对图1和图2中的线条EF或GK进行调整,以重新划分各编辑单兀。 4.删除一根或多根所述表格的线条,以被调整的线条为边界的多个编辑单元被合并,例如如果删除图1和图2中的线条HK,则编辑单元EHKD与编辑单元HFCK就合并成编辑单元EFCD。 5.增加一根或多根所述表格的线条,该线条穿过的编辑单元以该线条为边界被分成新的编辑单元。 以往的技术中,用户如果需要以电子形式传递纸件的表格文件,需要在拍摄表格文件后,将表格图片发送出去。如果要发送的是需要填写的表格,用户还要事先将表格填好,并且这样发送的表格也是用户手写填写的,此外,表格中如果发现有错误也无法进行修改,除非用户采用OFFICE等编辑软件对表格重新进行编辑排版,非常的不方便。但是,在采用本专利技术表格图像识别编辑方法之后,用户可以方便的对表格图像进行编辑修改,例如用户手写填写的表格,经过识别后可以变成标准的印刷体,如果发现纸件表格上存在错误,可以在拍摄之后方便的使用本专利技术进行修改,用户还可以在拍摄空白表格之后使用本专利技术在电子版本的表格上填写内容。 本专利技术还公开了一种实现上述表格图像识别编辑方法所采用的表格图像识别编辑装置,如图3所示,基于计算机系统,所述计算机系统可以包括个人电脑、智能手机、平板电脑等具有计算机硬件和相应的操作软件的系统。 本专利技术表格图像识别编辑装置包括:表格图像获取部件,获取所述表格图像,所述表格图像上包含有表格;划分部件,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;编辑部件,对一本文档来自技高网...
【技术保护点】
一种表格图像识别编辑方法,其特征在于,包括以下步骤:步骤一,获取所述表格图像,所述表格图像上包含有表格;步骤二,根据所述表格的线条,将所述表格图像划分为多个编辑单元,每个编辑单元都以所述表格的线条为边界,且每个编辑单元内不再有所述表格的线条;步骤三,对一个或多个编辑单元内的图像进行一次或多次的编辑操作,并根据编辑操作的结果,生成新的表格图像。
【技术特征摘要】
【专利技术属性】
技术研发人员:沈东辉,陈鹏渊,郑显军,
申请(专利权)人:上海合合信息科技发展有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。