图像处理方法、装置、存储介质及计算机设备制造方法及图纸

技术编号：39436111 阅读：13 留言：0更新日期：2023-11-19 16:19

本申请公开了一种图像处理方法，该方法包括：获取文档图像；将文档图像输入至分类模型，通过分类模型得到文档图像的分类信息；基于分类信息对文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理，得到预处理图像，预处理图像携带分类信息；基于分类信息对预处理图像进行颜色模型处理，得到文档图像对应的目标图像，该颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种。本申请应用人工智能技术可以实现对文档图像同时进行多维度的图像处理，使得不同类型的文档图像上的干扰信息和扭曲画面都能得到有效的优化，进而提高文档图像的显示效果和图像处理的效率。而提高文档图像的显示效果和图像处理的效率。而提高文档图像的显示效果和图像处理的效率。

全部详细技术资料下载

【技术实现步骤摘要】
图像处理方法、装置、存储介质及计算机设备

[0001]本申请涉及计算机视觉
，更具体地，涉及一种图像处理方法、装置、存储介质及计算机设备。

技术介绍

[0002]文档图像指的是通过摄像/扫描装置拍摄/扫描文档或屏幕截取文档得到的图像。在自动化办公场景中，通常需要将文档图像转换成不同的文档格式进行存储和显示。为此，用户对文档图像内容的显示效果有较高的要求，例如，需要清晰地凸显出文档图像中的文字内容。
[0003]由于文档图像在获取的过程中，很容易受到环境光线和拍摄人员摄影经验的影响，在使用文档图像前，会对获取的文档图像进行优化处理，以便得到符合使用需求的标准图片。而有关技术中对文档图像的优化处理比较简单，图像优化的效果较差。

技术实现思路

[0004]本申请实施例提供一种图像处理方法、装置、存储介质以及计算机设备。旨在提高文档图像的优化效果。
[0005]一方面，本申请实施例提供一种图像处理方法，该方法包括：获取文档图像；将文档图像输入至分类模型，通过分类模型得到文档图像的分类信息；基于分类信息对文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理，得到预处理图像，预处理图像携带分类信息；基于分类信息对预处理图像进行颜色模型处理，得到文档图像对应的目标图像，颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种；其中，增强模型为基于干扰图像和标准图像生成的合成图像作为样本数据，以及干扰图像和标准图像作为标签数据进行组合损失计算训练...

【技术保护点】

【技术特征摘要】
1.一种图像处理方法，其特征在于，所述方法包括：获取文档图像；将所述文档图像输入至分类模型，通过所述分类模型得到所述文档图像的分类信息；基于所述分类信息对所述文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理，得到预处理图像，所述预处理图像携带所述分类信息；基于所述分类信息对所述预处理图像进行颜色模型处理，得到所述文档图像对应的目标图像，所述颜色模型处理用于至少调整预处理图像的饱和度、对比度和亮度中的一种；其中，所述增强模型为基于干扰图像和标准图像生成的合成图像作为样本数据，以及干扰图像和标准图像作为标签数据进行组合损失计算训练得到，用于去除文档图像的干扰信息；所述校正模型为基于扭曲样本图像作为样本数据生成第一映射训练矩阵和第二映射训练矩阵，并将真实第一映射矩阵和真实第二映射矩阵作为标签数据进行二次映射校正训练得到，所述第二映射训练矩阵为基于所述第一映射训练矩阵对所述扭曲样本图像进行映射校正得到。2.根据权利要求1所述的方法，其特征在于，所述基于所述分类信息对所述文档图像按照基于增强模型的图像增强处理和基于校正模型的图像校正处理中的至少一种处理方式进行处理，得到预处理图像，包括：当所述文档图像的分类信息为非截屏图像时，将所述非截屏图像输入至增强模型，输出增强图像；将所述增强图像输入至校正模型，输出校正图像作为预处理图像。3.根据权利要求1所述的方法，其特征在于，所述增强模型通过如下步骤训练得到：获取第一训练数据集，所述第一训练数据集包括干扰图像和标准图像；对所述干扰图像和所述标准图像进行图像合成，得到合成图像；通过预设增强网络，预测所述合成图像中的预测干扰图像；根据所述合成图像与所述预测干扰图像得到去干扰图像；基于所述干扰图像和所述预测干扰图像，得到第一增强损失值；基于所述标准图像与所述去干扰图像，得到第二增强损失值；根据所述第一增强损失值和所述第二增强损失值的增强总损失值，对所述预设增强网络进行迭代训练，直至训练后的预设增强网络满足预设条件，得到所述增强模型。4.根据权利要求1所述的方法，其特征在于，所述校正模型通过如下步骤训练得到：获取第二训练数据集，所述第二训练数据集包括扭曲样本图像、真实第一映射矩阵和真实第二映射矩阵；通过所述第二训练数据集对预设校正网络中的第一映射网络和第二映射网络进行二次映射校正训练，直至所述预设校正网络满足预设条件，得到训练后的校正模型。5.根据权利要求4所述的方法，其特征在于，所述通过所述第二训练数据集对预设校正网络中的第一映射网络和第二映射网络进行二次映射校正训练，直至所述预设校正网络满足预设条件，得到训练后的校正模型，包括：将所述扭曲样本图像输入至第一映射网络，通过所述第一映射网络生成第一映射训练矩阵，所述第一映射网络用于预测所述扭曲样本图像的坐标映射信息；
基于所述第一映射训练矩阵和所述扭曲样本图像，得到中间校正图像；对所述中间校正图像进行坐标转换，得到中间映射矩阵，并基于所述中间映射矩阵和所述第一映射训练矩阵，得到拼接映射矩阵；将所述拼接映射矩阵输入至第二映射网络，得到第二映射训练矩阵，所述第二映...

【专利技术属性】
技术研发人员：余鹏飞，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人