一种图像矫正角度确定方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38207580 阅读:19 留言:0更新日期:2023-07-21 16:56
本发明专利技术公开了一种图像矫正角度确定方法、装置、电子设备及存储介质,方法包括:识别待检测的图像包含的目标朝向的象限;根据所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度;利用所述目标朝向的象限、所述目标朝向指定象限时所属的偏转范围和偏转角度确定所述图像的矫正角度。通过先预测目标朝向的象限,再预测目标朝向指定象限时的偏转角度。这种由粗到细的思想,相比直接对图进行360度分类,检测精度更高,且本发明专利技术能适用于任何场景的角度检测,通用性强。通用性强。通用性强。

【技术实现步骤摘要】
一种图像矫正角度确定方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,具体涉及一种图像矫正角度确定方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,由于图像采集设备原因或人为因素,获取到的图像通常会存在倾斜角度大的问题,因此在对图像进行分析与识别之前,需要检测图像的倾斜角度,以对图像进行转正处理。
[0003]在相关技术中,有基于投影法的角度检测方法,这种方法只适用于简单的OCR(Optical Character Recognition,光学字符识别)场景(例如PDF文档、身份证、护照、驾照、银行卡等转正处理),受噪声影响大,通用性差,还有使用深度学习模型对输入图像进行360度角度分类的方法,这种方法只能得到一个大概的角度区间,无法得到精确的角度。
[0004]因此,现有技术使用的角度检测方法存在通用性差、效果不好的问题。

技术实现思路

[0005]本专利技术的目的是针对上述现有技术的不足提出的一种图像矫正角度确定方法、装置、电子设备及存储介质,该目的是通过以下技术方案实现的。
[0006]本专利技术的第一方面提出了一种图像矫正角度确定方法,所述方法包括:
[0007]识别待检测的图像包含的目标朝向的象限;
[0008]根据所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度;
[0009]利用所述目标朝向的象限、所述目标朝向指定象限时所属的偏转范围和偏转角度确定所述图像的矫正角度。
[0010]在本申请的一些实施例中,所述识别待检测的图像中目标朝向的象限,包括:将待检测的图像输入已训练的检测模型,以由所述检测模型中的特征提取网络对所述图像进行特征提取,以得到第一特征图;
[0011]通过所述检测模型中的象限预测网络从所述特征提取网络获取所述第一特征图,并根据所述第一特征图预测所述图像中目标朝向的象限并输出。
[0012]在本申请的一些实施例中,所述根据所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度,包括:
[0013]通过所述检测模型中的角度预测网络获取所述第一特征图和所述目标朝向的象限,并根据所述第一特征图和所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度并输出。
[0014]在本申请的一些实施例中,由所述检测模型中的特征提取网络对所述图像进行特征提取,以得到第一特征图,包括:
[0015]通过所述特征提取网络中的卷积层对所述图像进行卷积处理后输入至所述特征
提取网络中的残差网络;通过所述残差网络对卷积处理后的图像进行多次下采样处理,以获得第一特征图。
[0016]在本申请的一些实施例中,通过所述残差网络对卷积处理后的图像进行多次下采样处理,以获得第一特征图,包括:
[0017]通过所述残差网络对卷积处理后的图像进行至少三次的下采样处理,以获得第一特征图。
[0018]在本申请的一些实施例中,通过所述残差网络对卷积处理后的图像进行至少三次的下采样处理,以获得第一特征图,包括:
[0019]通过所述残差网络中的第一残差块对卷积处理后的图像进行下采样处理以获得第一中间特征,并将第一中间特征输入至所述残差网络中的第二残差块;通过所述第二残差块对第一中间特征进行下采样处理以获得第二中间特征,并将第二中间特征输入至所述残差网络中的第三残差块;通过所述第三残差块对第二中间特征进行下采样处理以获得第三中间特征,并将第三中间特征输入至所述残差网络中的第四残差块;通过所述第四残差块对第三中间特征进行下采样处理,以获得第一特征图。
[0020]在本申请的一些实施例中,所述象限预测网络根据所述第一特征图预测所述图像中目标朝向的象限,包括:
[0021]通过所述象限预测网络中的第五残差块对所述第一特征图进行下采样处理后输入至所述象限预测网络中的象限分类网络;通过所述象限分类网络基于下采样处理后的第一特征图,确定目标朝向的象限。
[0022]在本申请的一些实施例中,所述角度预测网络根据所述第一特征图和所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围,包括:
[0023]通过所述角度预测网络中的旋转层根据所述目标朝向的象限旋转所述第一特征图得到第二特征图,以使所述目标朝向指定象限;通过所述角度预测网络中的范围预测网络从所述旋转层获取第二特征图,并基于所述第二特征图预测所述目标朝向指定象限所属的偏转范围。
[0024]在本申请的一些实施例中,所述角度预测网络根据所述第一特征图和所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转角度,包括:
[0025]通过所述角度预测网络中的偏转角预测网络从所述旋转层获取第二特征图,从所述范围预测网络获取所述目标朝向指定象限所属的偏转范围,并基于所述第二特征图和所述偏转范围预测偏转角度。
[0026]在本申请的一些实施例中,所述范围预测网络基于第二特征图预测所述目标朝向指定象限所属的偏转范围,包括:
[0027]通过所述范围预测网络中的第六残差块对第二特征图进行下采样处理后输入至所述范围预测网络中的范围分类网络;通过所述范围分类网络基于下采样处理后的第二特征图,确定所述目标朝向指定象限所属的偏转范围。
[0028]在本申请的一些实施例中,所述偏转角预测网络基于第二特征图和所述偏转范围预测偏转角度,包括:
[0029]通过所述偏转角预测网络中的翻转层根据所述偏转范围对所述第二特征图进行水平翻转得到第三特征图,以使所述目标朝向指定象限时属于指定偏转范围;通过所述偏
转角预测网络中的角度预测网络从所述翻转层获取第三特征图,并基于所述第三特征图预测目朝向指定象限的指定偏转范围内的偏转角度。
[0030]在本申请的一些实施例中,所述角度预测网络基于所述第三特征图预测目朝向指定象限的指定偏转范围内的偏转角度,包括:
[0031]通过所述角度预测网络中的第七残差块对所述第三特征图进行下采样处理后输入至所述角度预测网络中的角度分类网络;通过所述角度分类网络基于下采样处理后的第三特征图,确定所述目标朝向指定象限的指定偏转范围内的偏转角度。
[0032]在本申请的一些实施例中,所述方法还包括检测模型的训练过程:
[0033]获取样本图像;根据预先在直角坐标系上定义的象限线和角度线标注所述样本图像中目标朝向的象限标签、目标朝向指定象限时所属的偏转范围标签和偏转角度标签;利用标注后的样本图像对已构建的检测模型进行训练。
[0034]本专利技术的第二方面提出了一种图像矫正角度确定装置,所述装置包括:
[0035]象限识别模块,用于识别待检测的图像包含的目标朝向的象限;
[0036]偏转方向确定模块,用于根据所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度;
[0037]矫正角度确定模块,用于利用所述目标朝向的象限、所述目标朝向指定象限时所属的偏转范围和偏转本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像矫正角度确定方法,其特征在于,所述方法包括:识别待检测的图像包含的目标朝向的象限;根据所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度;利用所述目标朝向的象限、所述目标朝向指定象限时所属的偏转范围和偏转角度确定所述图像的矫正角度。2.根据权利要求1所述的方法,其特征在于,所述识别待检测的图像中目标朝向的象限,包括:将待检测的图像输入已训练的检测模型,以由所述检测模型中的特征提取网络对所述图像进行特征提取,以得到第一特征图;通过所述检测模型中的象限预测网络获取所述第一特征图,并根据所述第一特征图预测所述图像中目标朝向的象限并输出。3.根据权利要求2所述的方法,其特征在于,所述根据所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度,包括:通过所述检测模型中的角度预测网络获取所述第一特征图和所述目标朝向的象限,并根据所述第一特征图和所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围和偏转角度并输出。4.根据权利要求2所述的方法,其特征在于,由所述检测模型中的特征提取网络对所述图像进行特征提取,以得到第一特征图,包括:通过所述特征提取网络中的卷积层对所述图像进行卷积处理后输入至所述特征提取网络中的残差网络;通过所述残差网络对卷积处理后的图像进行多次下采样处理,以获得第一特征图。5.根据权利要求4所述的方法,其特征在于,通过所述残差网络对卷积处理后的图像进行多次下采样处理,以获得第一特征图,包括:通过所述残差网络对卷积处理后的图像进行至少三次的下采样处理,以获得第一特征图。6.根据权利要求5所述的方法,其特征在于,通过所述残差网络对卷积处理后的图像进行至少三次的下采样处理,以获得第一特征图,包括:通过所述残差网络中的第一残差块对卷积处理后的图像进行下采样处理以获得第一中间特征,并将第一中间特征输入至所述残差网络中的第二残差块;通过所述第二残差块对第一中间特征进行下采样处理以获得第二中间特征,并将第二中间特征输入至所述残差网络中的第三残差块;通过所述第三残差块对第二中间特征进行下采样处理以获得第三中间特征,并将第三中间特征输入至所述残差网络中的第四残差块;通过所述第四残差块对第三中间特征进行下采样处理,以获得第一特征图。7.根据权利要求2所述的方法,其特征在于,所述象限预测网络根据所述第一特征图预测所述图像中目标朝向的象限,包括:通过所述象限预测网络中的第五残差块对所述第一特征图进行下采样处理后输入至所述象限预测网络中的象限分类网络;通过所述象限分类网络基于下采样处理后的第一特征图,确定目标朝向的象限。
8.根据权利要求3所述的方法,其特征在于,所述角度预测网络根据所述第一特征图和所述目标朝向的象限确定所述目标朝向指定象限时所属的偏转范围,包括:通过所述角度预测网络中的旋转层根据所述目标朝向的象限旋转所述第一特征图得到第二特征图,以使所述目标朝向指定象...

【专利技术属性】
技术研发人员:降小龙
申请(专利权)人:北京新氧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1