System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文档图像的去阴影方法及相关装置制造方法及图纸_技高网

一种文档图像的去阴影方法及相关装置制造方法及图纸

技术编号:43642120 阅读:9 留言:0更新日期:2024-12-13 12:39
本申请提供一种文档图像的去阴影方法及相关装置,涉及图像处理领域。该方法包括:获取包括阴影区域的第一文档图像,调用阴影估计模型处理第一文档图像,得到对应的估计阴影图像,基于该估计阴影图像,去除第一文档图像中的阴影区域,得到第二文档图像。阴影估计模型是通过包括阴影损失函数的模型损失函数进行迭代训练得到的,阴影损失函数包括估计阴影图像与对应的实际的阴影区域之间的回归损失、总变差损失以及颜色损失。由于在训练过程中,增加了有关阴影区域的颜色损失进行监督训练,使得阴影估计模型输出的估计阴影图像不包括非阴影区域的深色元素,从而不会将非阴影区域的深色元素作为阴影区域去除,能够有效去除彩色文档图像中的阴影区域。

【技术实现步骤摘要】

本申请涉及图像处理领域,尤其涉及一种文档图像的去阴影方法及相关装置


技术介绍

1、随着信息技术的高速发展,以及办公、学习的数字化需求的不断增长,数字化的文档图像正在逐步替代原始的实体文档,能够提升日常办公、学习的效率,并且文档图像相较于实体文档来说,还具有不需要占据实体空间、管理方便、处理快捷等优点。获得文档图像的方式有很多,例如:可以使用手机的文档扫描功能使实体文档数字化,从而得到对应的文档图像。但是,在使用手机的文档扫描功能生成文档图像的过程中,由于拍摄环境的原因(例如:单光源、被遮挡、光线不足等)、人为原因等,可能会导致生成的文档图像部分区域被阴影遮盖,对文档的阅读、文档中文字信息和各种结构化元素的识别造成了影响。

2、针对文档图像部分区域被阴影遮盖的问题,当前技术中主要分为传统算法和深度学习方法。其中,传统算法一般采用注水算法(water filling),通过模拟注水的过程迭代地从图像边缘向图像中心扩散并估计阴影,利用估计阴影去除文档图像中包含的阴影;深度学习方法一般采用单幅文件图像去阴影的深度学习网络(background estimationdocument shadow removal network,bedsr-net)进行处理,首先背景估计模块提取文档图像的全局背景颜色、背景和非背景像素的空间分布信息,然后根据全局背景颜色和空间分布信息,实现文档图像的阴影去除。

3、当前技术中,用于去除文档图像的阴影的传统算法或者深度学习方法,适用于非彩色文档图像,而对于彩色文档图像,当前已有的方法没有办法有效地去除彩色文档图像中的阴影。


技术实现思路

1、本申请提供的一种文档图像的去阴影方法及相关装置,能够利用训练好的阴影估计模型输出的估计阴影图像,有效地去除彩色文档图像中的阴影区域,并且能够有效地保留文档图像中的非阴影区域的元素。

2、为达到上述目的,本申请采用如下技术方案:

3、本申请的第一方面提供一种文档图像的去阴影方法,该方法包括:获取包括阴影区域的第一文档图像,调用阴影估计模型处理第一文档图像,得到对应的估计阴影图像,基于该估计阴影图像,去除第一文档图像中的阴影区域,得到第二文档图像。阴影估计模型是通过包括阴影损失函数的模型损失函数进行迭代训练得到的,阴影损失函数包括估计阴影图像与对应的实际的阴影区域之间的回归损失、总变差损失以及颜色损失。由于在阴影估计模型的训练过程中,增加了有关文档图像阴影区域的颜色损失对阴影估计模型进行监督训练,使得阴影估计模型不会将非阴影区域的深色元素识别为阴影区域,输出不包含非阴影区域的深色元素的估计阴影图像,从而不会将第一文档图像中的非阴影区域的深色元素作为阴影区域去除,能够有效去除彩色文档图像中的阴影区域。

4、在一种可能的实现方式中,阴影估计模型输出的估计阴影图像与对应的实际的阴影区域图像之间的颜色损失是通过如下方式获得的:计算估计阴影图像的计算颜色图和阴影区域图像的计算颜色图;计算估计阴影图像的计算颜色图和阴影区域图像的计算颜色图之间的回归损失,得到估计阴影图像和对应的实际的阴影区域图像之间的颜色损失。

5、在一种可能的实现方式中,该阴影估计模型包括重参数化结构。重参数化结构能够在保证训练资源丰富,训练过程中构建的结构较大,从而使得模型能够具备较好的性能的同时,保证在推理过程中所消耗的资源较少。

6、在一种可能的实现方式中,在获取第一文档图像之前,该方法还包括:对该阴影估计模型进行预处理,预处理包括以下的一种或多种:重参数化处理、去输出处理和模型转换处理。能够减少阴影估计模型的结构,减少了阴影估计模型的参数,从而降低了内存占用的同时,提升了阴影估计模型的处理速度。

7、在一种可能的实现方式中,在获取第一文档图像之后,该方法还包括:对该第一文档图像进行归一化处理,得到处理后的第一文档图像;从而调用估计阴影图像处理该处理后的第一文档图像,得到第一文档图像对应的估计阴影图像。有利用提高阴影估计模型的处理性能。

8、在一种可能的实现方式中,当第一文档图像的尺寸与预设尺寸不一致时,在调用阴影估计模型处理第一文档图像,得到第一文档图像对应的估计阴影图像之前,将第一文档图像的尺寸调整为预设尺寸,得到第一图像,其中预设尺寸为阴影估计模型的输入图像的要求尺寸,调用阴影估计模型处理第一图像,得到第二图像,将第二图像的尺寸调整为第一文档图像的尺寸,从而得到第一文档图像对应的估计阴影图像。由于阴影区域的高频信息较少(即灰度变化的信息/像素较少),故对阴影区域图像来说,放大或缩小对阴影区域的内容几乎不会造成影响,故可以降低阴影估计模型中对分辨率的训练和推理,有效降低训练和处理的难度,并且不会影响文档图像的去阴影效果。

9、在一种可能的实现方式中,模型损失函数还包括去阴影损失函数,去阴影损失函数包括:阴影估计模型输出的目标文档图像与对应的实际的无阴影文档图像之间的回归损失。从而使得阴影估计模型能够输出去除阴影区域的目标文档图像,能够提高去除阴影区域的有效性。

10、在一种可能的实现方式中,该方法还包括:调用阴影估计模型处理该第一文档图像,得到第一文档图像对应的目标文档图像,基于第二文档图像和目标文档图像,得到最终的第二文档图像。增加阴影估计模型输出的目标文档图像,对文档图像的去除阴影区域的效果进行优化,提高了去除阴影区域的有效性。

11、在一种可能的实现方式中,模型损失函数还包括:复原损失函数;复原损失函数包括:复原文档图像与对应的实际的有阴影文档图像之间的回归损失;其中,复原文档图像是由阴影估计模型输出的估计阴影图像和阴影估计模型输出的目标文档图像合成得到的。增加复原损失函数,能够进一步监督训练阴影估计模型,提升阴影估计模型的准确性。

12、在一种可能的实现方式中,阴影估计模型的结构为对称编解码器结构。能够保证模型输出的信息量,更加适合完成去除文档图像的阴影区域的底层视觉任务。

13、在一种可能的实现方式中,回归损失为胡博损失。胡博损失将l1损失和l2损失的优势集中在一起而尽可能规避劣势的损失函数,降低了异常值对训练的影响,增强了的离群点鲁棒性,减少了对离群点的敏感问题。

14、第二方面,本申请提供了一种电子设备,该电子设备包括处理器和存储器;存储器存储计算机执行指令;处理器执行存储器存储的计算机执行指令,使得处理器执行上述第一方面的方法。

15、第三方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质中存储有计算机程序或指令,当计算机程序或指令被运行时,实现上述第一方面的方法。

16、第四方面,本申请提供了一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时,实现上述第一方面的方法。

本文档来自技高网...

【技术保护点】

1.一种文档图像的去阴影方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述阴影估计模型输出的估计阴影图像与对应的实际的阴影区域图像之间的颜色损失是通过如下方式得到的:

3.根据权利要求1所述的方法,其特征在于,所述阴影估计模型包括:重参数化结构。

4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述获取第一文档图像之前,所述方法还包括:

5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述获取第一文档图像之后,所述方法还包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述第一文档图像的尺寸与预设尺寸不一致;其中,所述预设尺寸为所述阴影估计模型的输入图像的要求尺寸;在所述调用阴影估计模型处理所述第一文档图像,得到所述第一文档图像对应的估计阴影图像之前,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述模型损失函数还包括:去阴影损失函数;所述去阴影损失函数包括:所述阴影估计模型输出的目标文档图像与对应的实际的无阴影文档图像之间的回归损失。

>8.根据权利要求7所述的方法,其特征在于,所述方法还包括:

9.根据权利要求7所述的方法,其特征在于,所述模型损失函数还包括:复原损失函数;所述复原损失函数包括:复原文档图像与对应的实际的有阴影文档图像之间的回归损失;其中,所述复原文档图像是由所述阴影估计模型输出的估计阴影图像和所述阴影估计模型输出的目标文档图像合成得到的。

10.根据权利要求1至9任一项所述的方法,其特征在于,所述阴影估计模型的结构为对称编解码器结构。

11.根据权利要求1至9任一项所述的方法,其特征在于,所述回归损失包括:胡博损失。

12.一种电子设备,其特征在于,包括处理器和存储器;

13.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机程序或指令,当所述计算机程序或指令被运行时,实现如权利要求1至11中任一项所述的方法。

...

【技术特征摘要】

1.一种文档图像的去阴影方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述阴影估计模型输出的估计阴影图像与对应的实际的阴影区域图像之间的颜色损失是通过如下方式得到的:

3.根据权利要求1所述的方法,其特征在于,所述阴影估计模型包括:重参数化结构。

4.根据权利要求1至3中任一项所述的方法,其特征在于,在所述获取第一文档图像之前,所述方法还包括:

5.根据权利要求1至4中任一项所述的方法,其特征在于,在所述获取第一文档图像之后,所述方法还包括:

6.根据权利要求1至5任一项所述的方法,其特征在于,所述第一文档图像的尺寸与预设尺寸不一致;其中,所述预设尺寸为所述阴影估计模型的输入图像的要求尺寸;在所述调用阴影估计模型处理所述第一文档图像,得到所述第一文档图像对应的估计阴影图像之前,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述模型损失函数还包括:去阴影损失函数;所述去阴影损...

【专利技术属性】
技术研发人员:张峻康孙斌宓振鹏
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1