文字检测识别方法、装置及设备制造方法及图纸

技术编号：36982725 阅读：13 留言：0更新日期：2023-03-25 18:01

本申请公开了一种文字检测识别方法、装置及设备。该方法包括：通过特征提取模块从输入的目标图像中提取多个不同尺度的特征图；通过检测特征金字塔模块中包含的第一指定数量的检测特征融合单元，对所述多个不同尺度的特征图进行检测特征融合得到检测融合特征图；以及通过识别特征金字塔模块中包含的第二指定数量的识别特征融合单元，对所述多个不同尺度的特征图进行识别特征融合得到识别融合特征图；通过文字检测模块基于所述检测融合特征图获取所述目标图像中的文本检测框；通过文字识别模块基于所述识别融合特征图识别所述目标图像中的文本检测框中的文字内容信息。像中的文本检测框中的文字内容信息。像中的文本检测框中的文字内容信息。

全部详细技术资料下载

【技术实现步骤摘要】
文字检测识别方法、装置及设备

[0001]本申请涉及图像处理
，尤其涉及一种文字检测识别方法、装置及设备。

技术介绍

[0002]目前，光学字符识别(Optical Character Recognition，OCR)技术主要分为两部分，即文字检测和文字识别。其中，文字检测是获取文字位置信息，其具体算法包括常用的faster
‑
rcnn系列的通用目标检测算法，用于生成适当预选框的CPTN算法，以及适用于非水平方向的SegLink检测算法。文字识别则是获取文字内容信息，其具体算法可包括结合CNN和RNN的CRNN算法、依赖文字序列关系的attention系列算法。
[0003]然而，这些算法都是单一形式的，即只是识别文字内容信息或者识别文字位置信息，无法做到端到端的文字检测与识别。

技术实现思路

[0004]本申请实施例提供一种文字检测识别方法，以解决现有技术中文字检测识别方法只能单一实现文字检测和识别中的一种任务的问题。
[0005]本申请实施例采用下述技术方案：
[0006]一种文字检测识别方法，包括：
[0007]通过特征提取模块从输入的目标图像中提取多个不同尺度的特征图；
[0008]通过检测特征金字塔模块中包含的第一指定数量的检测特征融合单元，对所述多个不同尺度的特征图进行检测特征融合得到检测融合特征图；以及通过识别特征金字塔模块中包含的第二指定数量的识别特征融合单元，对所述多个不同尺度的特征图进行识别特征融合得到识别融合特征图；...

【技术保护点】

【技术特征摘要】
1.一种文字检测识别方法，其特征在于，包括：通过特征提取模块从输入的目标图像中提取多个不同尺度的特征图；通过检测特征金字塔模块中包含的第一指定数量的检测特征融合单元，对所述多个不同尺度的特征图进行检测特征融合得到检测融合特征图；以及通过识别特征金字塔模块中包含的第二指定数量的识别特征融合单元，对所述多个不同尺度的特征图进行识别特征融合得到识别融合特征图；通过文字检测模块基于所述检测融合特征图获取所述目标图像中的文本检测框；通过文字识别模块基于所述识别融合特征图识别所述目标图像中的文本检测框中的文字内容信息。2.如权利要求1所述的方法，其特征在于，所述文字检测模块包括阈值化单元、概率化单元和二值化单元，所述通过文字检测模块基于所述检测融合特征图获取所述目标图像中的文本检测框，包括：通过所述阈值化单元基于所述检测融合特征图获取指定大小的阈值图，所述阈值图中包含有用于判断所述目标图像中各个像素点存在文字的阈值；通过所述概率化单元基于所述检测融合特征图获取指定大小的概率图，所述概率图中包含有所述目标图像中各个像素点存在文字的概率；通过所述二值化单元对所述阈值图和所述概率图进行逻辑运算，得到用于表征所述目标图像中的文本检测框的二值化特征图，以及基于所述二值化特征图获取所述目标图像中的文本检测框。3.如权利要求2所述的方法，其特征在于，所述通过所述阈值化单元基于所述检测融合特征图获取指定大小的阈值图，包括：通过所述阈值化单元对所述检测融合特征图进行指定卷积核的卷积运算、批标准化运算以及指定激活函数运算，得到第一特征图；采用反卷积的方式对所述第一特征图进行上采样，得到第二特征图，所述第二特征图为所述第一特征图的两倍大小；对所述第二特征图进行批标准化运算以及relu激活函数运算、以及采用反卷积的方式进行上采样，得到所述指定大小的阈值图。4.如权利要求2所述的方法，其特征在于，所述通过所述概率化单元基于所述检测融合特征图获取指定大小的概率图，包括：通过所述概率化单元对所述检测融合特征图进行指定卷积核的卷积运算、批标准化运算以及指定激活函数运算，得到第三特征图；采用反卷积的方式对所述第三特征图进行上采样，得到第四特征图，所述第四特征图为所述第三特征图的两倍大小；对所述第四特征图进行批标准化运算、relu激活函数运算、并采用反卷积的方式进行上采样、以及通过sigmoid激活函数进行概率预测，得到所述指定大小的概率图。5.如权利要求1所述的方法，其特征在于，所述通过文字识别模块基于所述识别融合...

【专利技术属性】
技术研发人员：傅陈钦，梁清华，霍树伟，周鑫，
申请(专利权)人：微梦创科网络科技中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人