图像校正方法、装置、设备及存储介质制造方法及图纸

技术编号：23025320 阅读：18 留言：0更新日期：2020-01-03 17:00

本发明专利技术实施例提供一种图像校正方法、装置、设备及存储介质，该方法包括：获取待校正的第一图像，其中，所述第一图像中包含多个文本区域；通过分割模型检测对所述第一图像进行倾斜校正；从所述第一图像中提取各个文本区域所在的文本区域图像，并通过分类模型识别各个文本区域图像中的文本是否倒置；在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时，确定所述第一图像为倒置，并将所述第一图像旋转为正立的图像。本发明专利技术实施例能够通过分割模型检测对第一图像进行倾斜校正，通过分类模型准确确定第一图像是否倒置，在第一图像为倒置时将第一图像旋转为正立的图像，从而实现对第一图像的倒置的校正。

Image correction method, device, equipment and storage medium

全部详细技术资料下载

【技术实现步骤摘要】
图像校正方法、装置、设备及存储介质
本专利技术实施例涉及图像处理
，尤其涉及一种图像校正方法、装置、设备及存储介质。
技术介绍
在现今数字信息化高速发展的大时代背景下，随着数码产品的拍照能力越来越出色，更多的将信息存储和传输依赖在数字图像这一媒介。而文本的数字图像化，如数字化图书库、电子书、文本扫描的发展，对文本转换技术提出了更高的要求。由于人为因素和硬件设备的限制，扫描的文本图像不可避免的存在某种程度倾斜，容易造成文字识别错误。现有技术中，通过采用基于投影的方法、基于Hough变换的方法、基于K-最近邻簇方法等基于传统图像处理方法，对文本图像进行倾斜校正。然而，现有的图像校正方法只能对文本图像进行倾斜校正，将倾斜的文本校正为非倾斜文本，但无法检测文本图像中的文本是否倒置，无法对文本图像的倒置进行校正，而倒置的文本图像难以进行文本识别。
技术实现思路
本专利技术实施例提供一种图像校正方法、装置、设备及存储介质，以解决现有的图像校正方法无法对文本图像的倒置进行校正的问题。第一方面，本专利技术实施例提供一种图像校正方法，包括：获取待校正的第一图像，其中，所述第一图像中包含多个文本区域；通过分割模型对所述第一图像进行倾斜校正；从所述第一图像中提取各个文本区域所在的文本区域图像，并通过分类模型识别各个文本区域图像中的文本是否倒置，以得到识别结果；在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时，确定所述第一图像为倒置，并将所述第一图像旋转为正...

【技术保护点】
1.一种图像校正方法，其特征在于，包括：/n获取待校正的第一图像，其中，所述第一图像中包含多个文本区域；/n通过分割模型对所述第一图像进行倾斜校正；/n从所述第一图像中提取各个文本区域所在的文本区域图像，并通过分类模型识别各个文本区域图像中的文本是否倒置；/n在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时，确定所述第一图像为倒置，并将所述第一图像旋转为正立的图像。/n

【技术特征摘要】
1.一种图像校正方法，其特征在于，包括：
获取待校正的第一图像，其中，所述第一图像中包含多个文本区域；
通过分割模型对所述第一图像进行倾斜校正；
从所述第一图像中提取各个文本区域所在的文本区域图像，并通过分类模型识别各个文本区域图像中的文本是否倒置；
在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时，确定所述第一图像为倒置，并将所述第一图像旋转为正立的图像。

2.根据权利要求1所述的方法，其特征在于，通过分割模型对所述第一图像进行倾斜校正，包括：
通过所述分割模型检测所述第一图像中的各个文本区域，得到掩膜图像；
确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度；
对各个旋转外接矩形的倾斜角度进行投票统计，选取票数最多的倾斜角度作为所述第一图像的倾斜角度；
根据所述第一图像的倾斜角度，对所述第一图像进行倾斜校正。

3.根据权利要求2所述的方法，其特征在于，确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度，包括：
确定所述掩膜图像上各个文本区域对应的旋转外接矩形的顶点坐标；
针对每个文本区域，根据该文本区域对应的旋转外接矩形的顶点坐标，计算该文本区域对应的旋转外接矩形的倾斜角度。

4.根据权利要求3所述的方法，其特征在于，根据所述第一图像的倾斜角度，对所述第一图像进行倾斜校正，包括：
根据所述第一图像的倾斜角度，确定旋转矩阵；
根据所述旋转矩阵，对所述第一图像进行倾斜校正；
从所述第一图像中提取各个文本区域所在的文本区域图像，包括：
根据所述旋转矩阵和各个文本区域对应的旋转外接矩形的顶点坐标，计算倾斜校正后第一图像中各个文本区域对应的外接矩形的顶点坐标；
针对每个文本图像，根据倾斜校正后第一图像中该文本区域对应的外接矩形的顶点坐标，提取该顶点坐标对应的图像作为该文本区域所在的文本区域图像。

5.根据权利要求1-3任一项所述的方法，其特征在于，从所述第一图像中提取各个文本区域所...

【专利技术属性】
技术研发人员：周康明，杨海林，
申请(专利权)人：上海眼控科技股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人