一种训练方法、图像质量确定方法及装置、电子设备制造方法及图纸

技术编号：30646800 阅读：26 留言：0更新日期：2021-11-04 00:56

本公开提供一种训练方法、图像质量确定方法及装置、电子设备，涉及图像质量分析技术领域。该训练方法包括：基于样本图像集生成多个多标签数据，每个多标签数据包括目标图像以及目标图像的多种质量标签的属性值，每个样本图像的分辨率与相应目标图像的分辨率相同，至少两个多标签数据包括的目标图像的尺寸不同，基于多个所述多标签数据分批次训练多标签分类模型，所述多标签分类模型在至少两批训练时的图像输入尺寸不同。训练完成的多标签分类模型支持多个尺寸的图像质量确定，具有较高的泛化能力和鲁棒性。能力和鲁棒性。能力和鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】
一种训练方法、图像质量确定方法及装置、电子设备

[0001]本公开涉及图像质量分析
，尤其涉及训练方法、图像质量确定方法及装置、电子设备。

技术介绍

[0002]目前，可以利用光学字符识别（Optical Character Recognition，缩写为OCR）技术对文本图像进行识别，从而识别到文本图像内的文本，因此，文本图像质量对文本识别正确性有着比较重要的影响。
[0003]在进行OCR识别前，可以对文本图像质量进行评估，然后根据评估结果对文本图像进行质量增强，继而提升文本图像的文本识别准确性。相关技术中，可以采用无参考图质量评价方法评估文本图像质量，如可以采用边缘检测或特征提取算法等传统图像处理算法判断图像边缘强度和模糊程度。

技术实现思路

[0004]根据本公开的一方面，提供了一种训练方法，包括：基于样本图像集生成多个多标签数据，每个所述多标签数据包括目标图像以及所述目标图像的N种质量标签的属性值，所述样本图像集含有的每个样本图像的分辨率与相应所述多标签数据含有的所述目标图像的分辨率相同，至少两个所述多标签数据包括的目标图像的尺寸不同，N为大于或等于2的整数；基于多个所述多标签数据分批次训练多标签分类模型，所述多标签分类模型在至少两批训练时的图像输入尺寸不同。
[0005]根据本公开的另一方面，提供了一种图像质量识别方法，包括：获取输入图像；基于多标签分类模型，确定所述输入图像的N种图像质量；其中，所述多标签分类模型在至少两批训练时的图像输入尺寸不同。
[000...

【技术保护点】

【技术特征摘要】
1.一种训练方法，其特征在于，包括：基于样本图像集生成多个多标签数据，每个所述多标签数据包括目标图像以及所述目标图像的N种质量标签的属性值，所述样本图像集含有的每个样本图像的分辨率与相应所述多标签数据含有的所述目标图像的分辨率相同，至少两个所述多标签数据包括的目标图像的尺寸不同，N为大于或等于2的整数；基于多个所述多标签数据分批次训练多标签分类模型，所述多标签分类模型在至少两批训练时的图像输入尺寸不同。2.根据权利要求1所述的方法，其特征在于，所述基于样本图像集生成多个多标签数据，包括：确定所述样本图像的尺寸等于多种所述图像输入尺寸中的一个的情况下，在所述样本图像上标注N种所述质量标签值的属性值，获得多标签数据；确定所述样本图像的尺寸不等于所有所述图像输入尺寸的情况下，对所述样本图像进行处理，获得所述目标图像，所述目标图像的尺寸等于多种所述图像输入尺寸中的一个；在所述目标图像上标注N种所述质量标签值的属性值，获得多标签数据；更新所述样本图像。3.根据权利要求2所述的方法，其特征在于，所述对所述样本图像进行处理，获得所述目标图像，包括：确定所述样本图像的长宽比值大于预设比值时，通过裁剪和拼接的方式处理所述样本图像，直到处理后的所述样本图像的长宽比值小于或等于预设比值；在处理后的所述样本图像的长宽比值小于或等于预设比值，处理后的所述样本图像的尺寸等于多种所述图像输入尺寸中的一个时，获得所述目标图像。4.根据权利要求3所述的方法，其特征在于，所述通过裁剪和拼接的方式处理所述样本图像，包括：以所述样本图像的宽边延伸方向为分割线方向将样本图像分成两等分，获得两个子样本图像；以所述样本图像的长边延伸方向为拼接线方向将两个所述子样本图像拼接在一起。5.根据权利要求2~4任一项所述的方法，其特征在于，当所述样本图像的长度大于多种所述图像输入尺寸中的最大尺寸，所述目标图像的尺寸等于所述最大尺寸；所述对所述样本图像进行处理，获得所述目标图像，包括：提取所述样本图像的梯度图；基于所述样本图像的梯度图获得感兴趣子图像，所述感兴趣子图像的长度等于所述最大尺寸；生成包含所述感兴趣子图像的所述目标图像。6.根据权利要求5所述的方法，其特征在于，所述感兴趣子图像为文本子图像；和/或，所述样本图像具有同样尺寸的多个候选子图像，所述感兴趣子图像为多个所述候选子图像中梯度和最大的一个。7.根据权利要求5所述的方法，其特征在于，当所述样本图像的宽度大于或等于所述最大尺寸，所述感兴趣子图像的宽度等于所述最大尺寸。8.根据权利要求5所述的方法，其特征在于，所述样本图像的宽度小于所述最大尺寸，
所述目标图像还包括第一填充子图像，所述第一填充子图像与所述感兴趣子图像沿着所述感兴趣子图像的宽度方向分布；和/或，所述生成包含所述感兴趣子图像的所述目标图像，包括：确定所述感兴趣子图像的宽度小于所述最大尺寸的情况下，在所述感兴趣子图像的长边拼接第一填充子图像，获得所述目标图像。9.根据权利要求8所述的方法，其特征在于，当所述最大尺寸对所述感兴趣子图像的宽度的向下取整结果大于或等于K，所述第一填充子图像包括K
‑
1个第一子图像，K为大于或等于1的整数，每个所述第一子图像为所述感兴趣子图像的复制图像；当所述最大尺寸对所述感兴趣子图像的宽度的取余结果为大于或等于1的整数，所述第一填充子图像包括第二子图像，所述第二子图像含有的各个像素的像素值相同。10.根据权利要求2~4任一项所述的方法，其特征在于，当所述样本图像的长度小于或等于多种所述图像输入尺寸中的最大尺寸，多个所述图像输入尺寸具有至少一个大于或等于所述样本图像的长度的目标图像输入尺寸，所述目标图像的尺寸为多个所述目标图像输入尺寸中的一个，所述目标图像包括样本图像和第二填充子图像，所述第二填充子图像至少包括拼接在所述样本图像的长边的第一方向填充子图像；所述对所述样本图像进行处理，获得所述目标图像，包括：确定所述样本图像的宽度小于所述目标图像的宽度的情况下，在所述样本图像的长边拼接第一方向填充子图像，获得扩张图像；确定所述样本图像的长度小于所述目标图像的长度的情况下，在所述扩张图像的长边拼接第二方向填充子图像，获得所述目标图像。11.根据权利要求10所述的方法，其特征在于，当所述目标图像的宽度对所述样本图像的宽度的向下取整结果大于或等于S，所述第二填充子图像包括S
‑
1个第三子图像，每个所述第三子图像为所述样本图像的复制图像，S为大于或等于1的整数；当所述目标图像的宽度对所述样本图像的宽度的取余结果为大于或等于1的整数，所述第二填充子图像包括第四子图像，所述第四子图像含有的各个像素的像素值相同；当所述目标图像的长度对所述样本图像的长度的向下取整结果大于或等于Q，所述第一方向填充子图像包括Q
‑
1个第五子图像，所述第五子图像为所述扩张图像的复制图像，所述扩张图像包括沿着所述样本图像的宽度方向分布的所述第二填充子图像和所述样本图像，Q为大于或等于1的整数；当所述目标图像的长度对所述样本图像的长度的取余结果为大于或等于1的整数，所述第一方向填充子图像包括第六子图像，所述第六子图像含有的各个像素的像素值相同。12.根据权利要求1~4任一项所述的方法，其特征在于，所述多标签分类模型包括第一子网络和第二子网络，所述第一子网络和所述第二子网络不同；所述第一子网络用于提取所述多标签数据含有的目标图像的多个特征图；所述第二子网络用于基于多个所述特征图提取N种质量特征图，基于每种所述质量特...

【专利技术属性】
技术研发人员：尹亮，
申请(专利权)人：北京世纪好未来教育科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人