图像校正方法、装置、设备及存储介质制造方法及图纸

技术编号:23025320 阅读:18 留言:0更新日期:2020-01-03 17:00
本发明专利技术实施例提供一种图像校正方法、装置、设备及存储介质,该方法包括:获取待校正的第一图像,其中,所述第一图像中包含多个文本区域;通过分割模型检测对所述第一图像进行倾斜校正;从所述第一图像中提取各个文本区域所在的文本区域图像,并通过分类模型识别各个文本区域图像中的文本是否倒置;在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时,确定所述第一图像为倒置,并将所述第一图像旋转为正立的图像。本发明专利技术实施例能够通过分割模型检测对第一图像进行倾斜校正,通过分类模型准确确定第一图像是否倒置,在第一图像为倒置时将第一图像旋转为正立的图像,从而实现对第一图像的倒置的校正。

Image correction method, device, equipment and storage medium

【技术实现步骤摘要】
图像校正方法、装置、设备及存储介质
本专利技术实施例涉及图像处理
,尤其涉及一种图像校正方法、装置、设备及存储介质。
技术介绍
在现今数字信息化高速发展的大时代背景下,随着数码产品的拍照能力越来越出色,更多的将信息存储和传输依赖在数字图像这一媒介。而文本的数字图像化,如数字化图书库、电子书、文本扫描的发展,对文本转换技术提出了更高的要求。由于人为因素和硬件设备的限制,扫描的文本图像不可避免的存在某种程度倾斜,容易造成文字识别错误。现有技术中,通过采用基于投影的方法、基于Hough变换的方法、基于K-最近邻簇方法等基于传统图像处理方法,对文本图像进行倾斜校正。然而,现有的图像校正方法只能对文本图像进行倾斜校正,将倾斜的文本校正为非倾斜文本,但无法检测文本图像中的文本是否倒置,无法对文本图像的倒置进行校正,而倒置的文本图像难以进行文本识别。
技术实现思路
本专利技术实施例提供一种图像校正方法、装置、设备及存储介质,以解决现有的图像校正方法无法对文本图像的倒置进行校正的问题。第一方面,本专利技术实施例提供一种图像校正方法,包括:获取待校正的第一图像,其中,所述第一图像中包含多个文本区域;通过分割模型对所述第一图像进行倾斜校正;从所述第一图像中提取各个文本区域所在的文本区域图像,并通过分类模型识别各个文本区域图像中的文本是否倒置,以得到识别结果;在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时,确定所述第一图像为倒置,并将所述第一图像旋转为正立的图像。在一种可能的实施方式中,通过分割模型对所述第一图像进行倾斜校正,包括:通过所述分割模型检测所述第一图像中的各个文本区域,得到掩膜图像;确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度;对各个旋转外接矩形的倾斜角度进行投票统计,选取票数最多的倾斜角度作为所述第一图像的倾斜角度;根据所述第一图像的倾斜角度,对所述第一图像进行倾斜校正。在一种可能的实施方式中,确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度,包括:确定所述掩膜图像上各个文本区域对应的旋转外接矩形的顶点坐标;针对每个文本区域,根据该文本区域对应的旋转外接矩形的顶点坐标,计算该文本区域对应的旋转外接矩形的倾斜角度。在一种可能的实施方式中,根据所述第一图像的倾斜角度,对所述第一图像进行倾斜校正,包括:根据所述第一图像的倾斜角度,确定旋转矩阵;根据所述旋转矩阵,对所述第一图像进行倾斜校正;从所述第一图像中提取各个文本区域所在的文本区域图像,包括:根据所述旋转矩阵和各个文本区域对应的旋转外接矩形的顶点坐标,计算倾斜校正后第一图像中各个文本区域对应的外接矩形的顶点坐标;针对每个文本图像,根据倾斜校正后第一图像中该文本区域对应的外接矩形的顶点坐标,提取该顶点坐标对应的图像作为该文本区域所在的文本区域图像。在一种可能的实施方式中,从所述第一图像中提取各个文本区域所在的文本区域图像,包括:从所述第一图像中确定预设范围参数对应的区域;从所述预设范围参数对应的区域中提取各个文本区域所在的文本区域图像。第二方面,本专利技术实施例提供一种图像校正装置,包括:获取模块,用于获取待校正的第一图像,其中,所述第一图像中包含多个文本区域;倾斜校正模块,用于通过分割模型对所述第一图像进行倾斜校正;识别模块,用于从所述第一图像中提取各个文本区域所在的文本区域图像,并通过分类模型识别各个文本区域图像中的文本是否倒置;处理模块,用于在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时,确定所述第一图像为倒置,并将所述第一图像旋转为正立的图像。在一种可能的实施方式中,所述倾斜校正模块,具体用于:从所述第一图像中提取各个文本区域所在的文本区域图像之前,通过所述分割模型检测所述第一图像中的各个文本区域,得到掩膜图像;确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度;对各个旋转外接矩形的倾斜角度进行投票统计,选取票数最多的倾斜角度作为所述第一图像的倾斜角度;根据所述第一图像的倾斜角度,对所述第一图像进行倾斜校正。在一种可能的实施方式中,所述倾斜校正模块,具体用于:确定所述掩膜图像上各个文本区域对应的旋转外接矩形的顶点坐标;针对每个文本区域,根据该文本区域对应的旋转外接矩形的顶点坐标,计算该文本区域对应的旋转外接矩形的倾斜角度。第三方面,本专利技术实施例提供一种图像校正设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行如上第一方面以及第一方面各种可能的实施方式所述的图像校正方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如上第一方面以及第一方面各种可能的实施方式所述的图像校正方法。本实施例提供的图像校正方法、装置、设备及存储介质,通过获取待校正的第一图像,其中,第一图像中包含多个文本区域;通过分割模型对第一图像进行倾斜校正;从第一图像中提取各个文本区域所在的文本区域图像,并通过分类模型识别各个文本区域图像中的文本是否倒置;在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时,确定所述第一图像为倒置,并将第一图像旋转为正立的图像,能够通过分割模型对第一图像进行倾斜校正,通过分类模型准确确定第一图像是否倒置,在第一图像为倒置时将第一图像旋转为正立的图像,从而实现对第一图像的倒置的校正。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的图像校正方法的流程示意图;图2为本专利技术又一实施例提供的图像校正方法的流程示意图;图3为本专利技术另一实施例提供的图像校正方法的流程示意图;图4为本专利技术实施例提供的掩膜图像的示意图;图5为本专利技术实施例提供的选取预设范围参数对应的区域的示意图;图6为本专利技术一实施例提供的图像校正装置的结构示意图;图7为本专利技术一实施例提供的图像校正设备的硬件结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。现有技术中,通本文档来自技高网...

【技术保护点】
1.一种图像校正方法,其特征在于,包括:/n获取待校正的第一图像,其中,所述第一图像中包含多个文本区域;/n通过分割模型对所述第一图像进行倾斜校正;/n从所述第一图像中提取各个文本区域所在的文本区域图像,并通过分类模型识别各个文本区域图像中的文本是否倒置;/n在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时,确定所述第一图像为倒置,并将所述第一图像旋转为正立的图像。/n

【技术特征摘要】
1.一种图像校正方法,其特征在于,包括:
获取待校正的第一图像,其中,所述第一图像中包含多个文本区域;
通过分割模型对所述第一图像进行倾斜校正;
从所述第一图像中提取各个文本区域所在的文本区域图像,并通过分类模型识别各个文本区域图像中的文本是否倒置;
在文本倒置的文本区域图像的个数大于文本非倒置的文本区域图像的个数时,确定所述第一图像为倒置,并将所述第一图像旋转为正立的图像。


2.根据权利要求1所述的方法,其特征在于,通过分割模型对所述第一图像进行倾斜校正,包括:
通过所述分割模型检测所述第一图像中的各个文本区域,得到掩膜图像;
确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度;
对各个旋转外接矩形的倾斜角度进行投票统计,选取票数最多的倾斜角度作为所述第一图像的倾斜角度;
根据所述第一图像的倾斜角度,对所述第一图像进行倾斜校正。


3.根据权利要求2所述的方法,其特征在于,确定所述掩膜图像上各个文本区域对应的旋转外接矩形的倾斜角度,包括:
确定所述掩膜图像上各个文本区域对应的旋转外接矩形的顶点坐标;
针对每个文本区域,根据该文本区域对应的旋转外接矩形的顶点坐标,计算该文本区域对应的旋转外接矩形的倾斜角度。


4.根据权利要求3所述的方法,其特征在于,根据所述第一图像的倾斜角度,对所述第一图像进行倾斜校正,包括:
根据所述第一图像的倾斜角度,确定旋转矩阵;
根据所述旋转矩阵,对所述第一图像进行倾斜校正;
从所述第一图像中提取各个文本区域所在的文本区域图像,包括:
根据所述旋转矩阵和各个文本区域对应的旋转外接矩形的顶点坐标,计算倾斜校正后第一图像中各个文本区域对应的外接矩形的顶点坐标;
针对每个文本图像,根据倾斜校正后第一图像中该文本区域对应的外接矩形的顶点坐标,提取该顶点坐标对应的图像作为该文本区域所在的文本区域图像。


5.根据权利要求1-3任一项所述的方法,其特征在于,从所述第一图像中提取各个文本区域所...

【专利技术属性】
技术研发人员:周康明杨海林
申请(专利权)人:上海眼控科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1