图像处理方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:39436111 阅读:13 留言:0更新日期:2023-11-19 16:19
本申请公开了一种图像处理方法,该方法包括:获取文档图像;将文档图像输入至分类模型,通过分类模型得到文档图像的分类信息;基于分类信息对文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理,得到预处理图像,预处理图像携带分类信息;基于分类信息对预处理图像进行颜色模型处理,得到文档图像对应的目标图像,该颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种。本申请应用人工智能技术可以实现对文档图像同时进行多维度的图像处理,使得不同类型的文档图像上的干扰信息和扭曲画面都能得到有效的优化,进而提高文档图像的显示效果和图像处理的效率。而提高文档图像的显示效果和图像处理的效率。而提高文档图像的显示效果和图像处理的效率。

【技术实现步骤摘要】
图像处理方法、装置、存储介质及计算机设备


[0001]本申请涉及计算机视觉
,更具体地,涉及一种图像处理方法、装置、存储介质及计算机设备。

技术介绍

[0002]文档图像指的是通过摄像/扫描装置拍摄/扫描文档或屏幕截取文档得到的图像。在自动化办公场景中,通常需要将文档图像转换成不同的文档格式进行存储和显示。为此,用户对文档图像内容的显示效果有较高的要求,例如,需要清晰地凸显出文档图像中的文字内容。
[0003]由于文档图像在获取的过程中,很容易受到环境光线和拍摄人员摄影经验的影响,在使用文档图像前,会对获取的文档图像进行优化处理,以便得到符合使用需求的标准图片。而有关技术中对文档图像的优化处理比较简单,图像优化的效果较差。

技术实现思路

[0004]本申请实施例提供一种图像处理方法、装置、存储介质以及计算机设备。旨在提高文档图像的优化效果。
[0005]一方面,本申请实施例提供一种图像处理方法,该方法包括:获取文档图像;将文档图像输入至分类模型,通过分类模型得到文档图像的分类信息;基于分类信息对文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理,得到预处理图像,预处理图像携带分类信息;基于分类信息对预处理图像进行颜色模型处理,得到文档图像对应的目标图像,颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种;其中,增强模型为基于干扰图像和标准图像生成的合成图像作为样本数据,以及干扰图像和标准图像作为标签数据进行组合损失计算训练得到,用于去除文档图像的干扰信息;校正模型为基于扭曲样本图像作为样本数据生成第一映射训练矩阵和第二映射训练矩阵,并将真实第一映射矩阵和真实第二映射矩阵作为标签数据进行二次映射校正训练得到,第二映射训练矩阵为基于第一映射训练矩阵对扭曲样本图像进行映射校正得到。
[0006]另一方面,本申请实施例还提供一种视频处理装置,该装置包括:图像获取模块,用于获取文档图像;图像分类模块,用于将文档图像输入至分类模型,通过分类模型得到文档图像的分类信息;图像处理模块,用于基于分类信息对文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理,得到预处理图像,预处理图像携带分类信息;图像调整模块,用于基于分类信息对预处理图像进行颜色模型处理,得到文档图像对应的目标图像,颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种;其中,增强模型为基于干扰图像和标准图像生成的合成图像作为样本数据,以及干扰图像和标准图像作为标签数据进行组合损失计算训练得到,用于去除文档图像的干扰信息;校正模型为基于扭曲样本图像作为样本数据生成第一映射训练矩
阵和第二映射训练矩阵,并将真实第一映射矩阵和真实第二映射矩阵作为标签数据进行二次映射校正训练得到,第二映射训练矩阵为基于第一映射训练矩阵对扭曲样本图像进行映射校正得到。
[0007]另一方面,本申请实施例还提供一种计算机可读存储介质,该计算机可读存储介质存储有程序代码,其中,在所述程序代码被处理器运行时执行上述的图像处理方法。
[0008]另一方面,本申请实施例还提供一种计算机设备,该计算机设备包括处理器以及存储器,存储器存储有计算机程序指令,计算机程序指令被处理器调用时执行上述的图像处理方法。
[0009]另一方面,本申请实施例还提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,所述计算机指令存储在存储介质中;计算机设备的处理器从存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述图像处理方法中的步骤。
[0010]本申请提供的一种图像处理方法,可以获取文档图像,并将文档图像输入至分类模型,得到文档图像的分类信息,进而基于分类信息对文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理,得到预处理图像,该预处理图像携带分类信息,并基于分类信息对预处理图像进行颜色模型处理,得到文档图像对应的目标图像,该颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种。其中,增强模型为基于干扰图像和标准图像生成的合成图像作为样本数据,以及干扰图像和标准图像作为标签数据进行组合损失计算训练得到,用于去除文档图像的干扰信息;校正模型为基于扭曲样本图像作为样本数据生成第一映射训练矩阵和第二映射训练矩阵,并将真实第一映射矩阵和真实第二映射矩阵作为标签数据进行二次映射校正训练得到,第二映射训练矩阵为基于第一映射训练矩阵对扭曲样本图像进行映射校正得到。如此,通过对文档图像进行分类,可以对不同图像类型的文档图像进行多个维度的图像预处理,包括至少去除文档图像上的干扰信息或校正文档图像的画面扭曲,从而为文档图像进行多项优化提供了整体解决方案,大大提高文档图像的优化效果和效率。
附图说明
[0011]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0012]图1示出了本申请实施例提供的一种系统架构示意图。
[0013]图2示出了本申请实施例提供的一种图像处理方法的流程示意图。
[0014]图3示出了本申请实施例提供的一种图像处理方法的流程图。
[0015]图4示出了本申请实施例提供的另一种图像处理方法的流程示意图。
[0016]图5示出了本申请实施例提供的一种图像处理方法的应用场景图。
[0017]图6示出了本申请实施例提供的一种预设增强网络的网络架构图。
[0018]图7示出了本申请实施例提供的一种预设校正网络的网络架构图。
[0019]图8示出了本申请实施例提供的一种分类模型的网络结构图。
[0020]图9示出了本申请实施例提供的一种自适应的灰度处理流程图。
[0021]图10示出了本申请实施例提供的另一种自适应的灰度处理流程图。
[0022]图11是本申请实施例提供的一种图像处理装置的模块框图。
[0023]图12是本申请实施例提供的一种计算机设备的模块框图。
[0024]图13是本申请实施例提供的一种计算机可读存储介质的模块框图。
具体实施方式
[0025]下面详细描述本申请的实施方式,实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性地,仅用于解释本申请,而不能理解为对本申请的限制。
[0026]在说明书、权利要求书和上述附图所描述的一些流程中,包含了按照特定顺序出现的多个步骤,但应该清楚了解,这些步骤可以不按照其在本文中出现的顺序来执行或并行执行,步骤序号仅仅是用于区分开各个不同的步骤,序号本身不代表任何的执行顺序。此外,本文中的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法,其特征在于,所述方法包括:获取文档图像;将所述文档图像输入至分类模型,通过所述分类模型得到所述文档图像的分类信息;基于所述分类信息对所述文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理,得到预处理图像,所述预处理图像携带所述分类信息;基于所述分类信息对所述预处理图像进行颜色模型处理,得到所述文档图像对应的目标图像,所述颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种;其中,所述增强模型为基于干扰图像和标准图像生成的合成图像作为样本数据,以及干扰图像和标准图像作为标签数据进行组合损失计算训练得到,用于去除文档图像的干扰信息;所述校正模型为基于扭曲样本图像作为样本数据生成第一映射训练矩阵和第二映射训练矩阵,并将真实第一映射矩阵和真实第二映射矩阵作为标签数据进行二次映射校正训练得到,所述第二映射训练矩阵为基于所述第一映射训练矩阵对所述扭曲样本图像进行映射校正得到。2.根据权利要求1所述的方法,其特征在于,所述基于所述分类信息对所述文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理,得到预处理图像,包括:当所述文档图像的分类信息为非截屏图像时,将所述非截屏图像输入至增强模型,输出增强图像;将所述增强图像输入至校正模型,输出校正图像作为预处理图像。3.根据权利要求1所述的方法,其特征在于,所述增强模型通过如下步骤训练得到:获取第一训练数据集,所述第一训练数据集包括干扰图像和标准图像;对所述干扰图像和所述标准图像进行图像合成,得到合成图像;通过预设增强网络,预测所述合成图像中的预测干扰图像;根据所述合成图像与所述预测干扰图像得到去干扰图像;基于所述干扰图像和所述预测干扰图像,得到第一增强损失值;基于所述标准图像与所述去干扰图像,得到第二增强损失值;根据所述第一增强损失值和所述第二增强损失值的增强总损失值,对所述预设增强网络进行迭代训练,直至训练后的预设增强网络满足预设条件,得到所述增强模型。4.根据权利要求1所述的方法,其特征在于,所述校正模型通过如下步骤训练得到:获取第二训练数据集,所述第二训练数据集包括扭曲样本图像、真实第一映射矩阵和真实第二映射矩阵;通过所述第二训练数据集对预设校正网络中的第一映射网络和第二映射网络进行二次映射校正训练,直至所述预设校正网络满足预设条件,得到训练后的校正模型。5.根据权利要求4所述的方法,其特征在于,所述通过所述第二训练数据集对预设校正网络中的第一映射网络和第二映射网络进行二次映射校正训练,直至所述预设校正网络满足预设条件,得到训练后的校正模型,包括:将所述扭曲样本图像输入至第一映射网络,通过所述第一映射网络生成第一映射训练矩阵,所述第一映射网络用于预测所述扭曲样本图像的坐标映射信息;
基于所述第一映射训练矩阵和所述扭曲样本图像,得到中间校正图像;对所述中间校正图像进行坐标转换,得到中间映射矩阵,并基于所述中间映射矩阵和所述第一映射训练矩阵,得到拼接映射矩阵;将所述拼接映射矩阵输入至第二映射网络,得到第二映射训练矩阵,所述第二映...

【专利技术属性】
技术研发人员:余鹏飞
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1