一种文本图像倾斜角度的检测方法及装置制造方法及图纸

技术编号:27199854 阅读:15 留言:0更新日期:2021-01-31 12:05
本说明书实施例提供了文本图像倾斜角度的检测方法及装置,通过预先训练好包含一阶段二分类网络模型和多阶段多分类网络模型的深度神经网络模型集合,在获取到目标文本图像信息后,结合该目标文本图像信息对应的倾斜角度用途标注信息,确定对应的目标神经网络模型,再利用该目标神经网络模型识别得到目标文本图像信息的图像倾斜角度数据,这样能够提高图像倾斜角度的确定准确率,提高图像倾斜角度的识别效率,提升了图像倾斜角度的参考价值,以便作为后续文本图像处理的关键依据;另外,针对多阶段多分类网络模型,通过对目标文本图像信息执行多次倾斜角度类别识别,实现由大角度区间类别到小角度区间类别逐层细化确定最终的图像倾斜角度数据。的图像倾斜角度数据。的图像倾斜角度数据。

【技术实现步骤摘要】
一种文本图像倾斜角度的检测方法及装置


[0001]本文件涉及文本图像倾斜角度的检测领域,尤其涉及一种文本图像倾斜角度的检测方法及装置。

技术介绍

[0002]目前,光学字符识别(Optical Character Recognition,OCR)是指对文本图像进行处理,获取文字及版面信息的过程,也是光学理论实践应用的一个重要研究方向。不论是传统意义上OCR技术还是基于深度学习的OCR技术,均需要获得更高的文字识别精度和准确率。
[0003]随着深度学习技术的发展,人们在文字识别方法上取得了很大的进步,已经将文本检测和文本识别集成到了一个模型中。从单一的水平直线文字行到现在的各类曲线文字行都能有很好的识别结果。然而,文字识别过程中要求单个文字方向要保持大致上的“正立”,如果出现“倒立”的文字,识别准确率就会变得很低,可见文字识别准确率除了与识别方法有关以外,还与文本图像中文字的倾斜方向和角度也密切相关。
[0004]其中,常见的文本倾斜角度方法主要有投影法、Hough变换法、K-最近邻簇法、Fourier变换法及其变种方法。这些方法的基本原理都是先检测文本图像中的直线特征,利用直线的斜率来确定文本图像的倾斜角度,然后再进行倾斜校正。这些检测方法均需要文本图像中一定要有直线特征或类似于直线的特征,人们常常对文本图像进行游长平滑及细化处理来获取文本行直线。由于直线的倾斜角度范围是在
±
90
°
之间,而文本图像的倾斜角度范围是在
±
180
°/>之间,因此,当文本图像旋转180
°
成为倒立图像时,利用常规的倾斜角度检测方法无法得到准确度倾斜角度。也就是说,当文本图像倾斜角度大于90
°
或小于90
°
时,利用将直线的倾斜角理解为文本图像的倾斜角都是错误的。由于文本图像倾斜程度不仅与角度有关也与方向有关,而常规的直线检测法是无法检测出旋转方向的。
[0005]由此可知,需要一种不依赖直线特征的、更加普适的、准确度更高地文本图像倾斜角度检测的方法。

技术实现思路

[0006]本说明书一个或多个实施例的目的是提供一种文本图像倾斜角度的检测方法。该文本图像倾斜角度的检测方法包括:
[0007]获取待检测的目标文本图像信息;
[0008]基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;
[0009]利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据;其中,所述图像倾斜角度数据是基于对所述目标文本图像信息执行至少一次倾斜角度类别识别所确定的。
[0010]本说明书一个或多个实施例的目的是提供一种文本图像倾斜角度的检测装置。该文本图像倾斜角度的检测装置包括:
[0011]文本图像获取模块,用于获取待检测的目标文本图像信息;
[0012]目标网络选取模块,用于基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;
[0013]倾斜角度确定模块,用于利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据;其中,所述图像倾斜角度数据是基于对所述目标文本图像信息执行至少一次倾斜角度类别识别所确定的。
[0014]本说明书一个或多个实施例的目的是提供一种文本图像倾斜角度的检测设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器。
[0015]所述计算机可执行指令在被执行时使所述处理器获取待检测的目标文本图像信息;
[0016]基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;
[0017]利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据;其中,所述图像倾斜角度数据是基于对所述目标文本图像信息执行至少一次倾斜角度类别识别所确定的。
[0018]本说明书一个或多个实施例的目的是提供一种存储介质,用于存储计算机可执行指令。所述可执行指令在被处理器执行时获取待检测的目标文本图像信息;
[0019]基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;
[0020]利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据;其中,所述图像倾斜角度数据是基于对所述目标文本图像信息执行至少一次倾斜角度类别识别所确定的。
[0021]本说明书实施例提供的文本图像倾斜角度的检测方法及装置,通过预先训练好包含一阶段二分类网络模型和多阶段多分类网络模型的深度神经网络模型集合,在获取到目标文本图像信息后,结合该目标文本图像信息对应的倾斜角度用途标注信息,确定对应的目标神经网络模型,再利用该目标神经网络模型识别得到目标文本图像信息的图像倾斜角度数据,这样能够提高图像倾斜角度的确定准确率,提高图像倾斜角度的识别效率,提升了图像倾斜角度的参考价值,以便作为后续文本图像处理的关键依据;另外,针对多阶段多分类网络模型,通过对目标文本图像信息执行多次倾斜角度类别识别,实现由大角度区间类别到小角度区间类别逐层细化确定最终的图像倾斜角度数据。
附图说明
[0022]为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将
对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本说明书一个或多个实施例提供的文本图像倾斜角度的检测方法的第一种流程示意图;
[0024]图2为本说明书一个或多个实施例提供的文本图像倾斜角度的检测方法的第二种流程示意图;
[0025]图3为本说明书一个或多个实施例提供的文本图像倾斜角度的检测方法中的多阶段多分类网络模型的模型结构示意图之一;
[0026]图4为本说明书一个或多个实施例提供的文本图像倾斜角度的检测方法中的多阶段多分类网络模型的模型结构示意图之二;
[0027]图5为本说明书一个或多个实施例提供的文本图像倾斜角度的检测方法中的多阶段多分类网络模型的模型结构示意图之三;本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本图像倾斜角度的检测方法,包括:获取待检测的目标文本图像信息;基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型;其中,所述深度神经网络模型集合包括:一阶段二分类网络模型和多阶段多分类网络模型;利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据;其中,所述图像倾斜角度数据是基于对所述目标文本图像信息执行至少一次倾斜角度类别识别所确定的。2.根据权利要求1所述的方法,其中,所述多阶段多分类网络模型是基于预设树状网络结构所构建的;所述预设树状网络结构包括:多个倾斜角度识别阶段,每个倾斜角度识别阶段包括:至少一个倾斜角度识别分支;每个所述倾斜角度识别分支对应两个倾斜角度类别或多个倾斜角度类别;下一倾斜角度识别分支对应的倾斜角度类别包括:将上一倾斜角度识别分支对应的倾斜角度类别按照预设角度间隔划分得到的至少两个倾斜角度类别;每个所述倾斜角度识别分支对应于一个分类神经网络,所述分类神经网络包括二分类神经网络、或者多分类神经网络。3.根据权利要求2所述的方法,其中,若所述目标神经网络模型为多阶段多分类网络模型;所述利用所述目标神经网络模型,对所述目标文本图像信息进行图像倾斜角度识别处理,得到所述目标文本图像信息的图像倾斜角度数据,包括:将所述目标文本图像信息输入至所述目标神经网络模型中的首个倾斜角度识别阶段对应的分类神经网络,得到第一倾斜角度类别;将所述目标文本图像信息输入至下一倾斜角度识别阶段中的目标分类神经网络,得到第二倾斜角度类别;其中,所述目标分类神经网络为与针对上一倾斜角度识别阶段所确定出的倾斜角度类别下的倾斜角度识别分支对应的分类神经网络;若所述第二倾斜角度类别不为任一最小倾斜角度类别,则继续将所述目标文本图像信息输入至下一倾斜角度识别阶段中的目标分类神经网络;若所述第二倾斜角度类别为任一最小倾斜角度类别,则将所述第二倾斜角度类别确定为所述目标文本图像信息的图像倾斜角度数据。4.根据权利要求3所述的方法,其中,所述分类神经网络包括:图像输入层、图像预处理网络层、多个多层网络单元、全局平均池化层、逻辑回归网络层、分类结果输出层;每个所述多层网络单元包括:批量标准化处理层、卷积层、激活层、最大池化层中至少一项;所述将所述目标文本图像信息输入至下一倾斜角度识别阶段中的目标分类神经网络,得到第二倾斜角度类别,包括:将所述目标文本图像信息输入至所述图像输入层,得到所述目标文本图像信息对应的第一图像矩阵数据;将所述第一图像矩阵数据输入至所述图像预处理网络层,对所述第一图像矩阵数据进行归一化处理,得到第二图像矩阵数据;
将所述第二图像矩阵数据依次输入至多个所述多层网络单元,对所述第二图像矩阵数据进行图像特征提取,得到综合图像矩阵数据;将所述综合图像矩阵数据输入至所述全局平均池化层,对所述综合图像矩阵数据进行平均池化处理,得到第一图像特征向量;将所述第一图像特征向量输入至所述逻辑回归网络层,对所述第一图像特征向量进行逻辑回归处理,得到第二图像特征向量;将所述第二图像特征向量输入至所述分类结果输出层,得到第二倾斜角度类别。5.根据权利要求1所述的方法,其中,所述基于所述目标文本图像信息的倾斜角度用途标注信息,在预先训练好的深度神经网络模型集合中选择目标神经网络模型,包括:基于所述目标文本图像信息的倾斜角度用途标注信息,确定所述目标文本图像信息对应的倾斜角度精度要求等级;若所述倾斜角度精度要求等级小于预设阈值等级,则在预先训练好的深度神经网络模型集合中,将所述一阶段二分类网络模型确定为目标神经网络模型;若所述倾斜角度精度要求等级大于或等于预设阈值等级,则在预先训练好的深度神经网络...

【专利技术属性】
技术研发人员:郭从洲李可朱奕坤童晓冲李贺魏鑫王习文张锦添雷毅
申请(专利权)人:中国人民解放军战略支援部队信息工程大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1