端到端文本识别方法、装置、设备及存储介质制造方法及图纸

技术编号：36354186 阅读：47 留言：0更新日期：2023-01-14 18:10

本公开提供了一种端到端文本识别方法、装置、设备及存储介质，可以应用于深度学习技术领域和金融技术领域。该方法包括：将待测图像输入特征提取网络，利用分辨率注意力机制提取第一特征图像，其中，第一特征图像中包括待测图像中的局部特征图像和全局特征图像；利用控制点定位网络对第一特征图像进行校正处理，得到第二特征图像；将第二特征图像输入文本识别网络，输出与待测图像对应的文本信息。输出与待测图像对应的文本信息。输出与待测图像对应的文本信息。

全部详细技术资料下载

【技术实现步骤摘要】
端到端文本识别方法、装置、设备及存储介质

[0001]本公开涉及深度学习
和金融
，尤其涉及一种端到端文本识别方法、装置、设备、介质和程序产品。

技术介绍

[0002]相关技术中，针对任意形状的端到端的文本检测与识别方法，主要存在以下缺陷：由于文本分辨率低，存在很多低分辨率的图像，对文本检测带来较大的影响；由于文本拍摄者比较随意，可能产生曝光、抖动的情况，致使检测识别准确率低；由于文本含有印章等不规则形状，对后续文字的识别效果有着关键的影响，从而影响了文本识别的准确率。

技术实现思路

[0003]鉴于上述问题，本公开提供了一种端到端文本识别方法、装置、设备、介质和程序产品。
[0004]根据本公开的第一个方面，提供了一种端到端文本识别方法，包括：将待测图像输入特征提取网络，利用分辨率注意力机制提取第一特征图像，其中，上述第一特征图像中包括上述待测图像中的局部特征图像和全局特征图像；利用控制点定位网络对上述第一特征图像进行校正处理，得到第二特征图像；将上述第二特征图像输入文本识别网络，输出与上述待测图像对应的文本信息。
[0005]根据本公开的实施例，上述将待测图像输入特征提取网络，利用分辨率注意力机制提取第一特征图像，包括：将待测图像输入特征提取网络，利用分辨率注意力机制分别提取上述局部特征图像和上述全局特征图像；将上述局部特征图像和上述全局特征图像进行拼接，得到上述第一特征图像。
[0006]根据本公开的实施例，上述分辨率注意力机制包括第一分辨率注意力机制和第二分...

【技术保护点】

【技术特征摘要】
1.一种端到端文本识别方法，包括：将待测图像输入特征提取网络，利用分辨率注意力机制提取第一特征图像，其中，所述第一特征图像中包括所述待测图像中的局部特征图像和全局特征图像；利用控制点定位网络对所述第一特征图像进行校正处理，得到第二特征图像；将所述第二特征图像输入文本识别网络，输出与所述待测图像对应的文本信息。2.根据权利要求1所述的方法，其中，所述将待测图像输入特征提取网络，利用分辨率注意力机制提取第一特征图像，包括：将待测图像输入特征提取网络，利用分辨率注意力机制分别提取所述局部特征图像和所述全局特征图像；将所述局部特征图像和所述全局特征图像进行拼接，得到所述第一特征图像。3.根据权利要求2所述的方法，其中，所述分辨率注意力机制包括第一分辨率注意力机制和第二分辨率注意力机制，所述将待测图像输入特征提取网络，利用分辨率注意力机制分别提取所述局部特征图像和所述全局特征图像，包括：将待测图像输入特征提取网络，按照预设分配参数，将所述待测图像的全部特征进行分组，得到局部特征集合和全局特征集合；利用所述第一分辨率注意力机制对所述局部特征集合进行处理，得到所述局部特征图像；利用平均池化层和所述第二分辨率注意力机制对所述全局特征集合进行处理，得到所述全局特征图像。4.根据权利要求3所述的方法，其中，所述将待测图像输入特征提取网络，按照预设分配参数，将所述待测图像的全部特征进行分组，得到局部特征集合和全局特征集合，包括：基于多头注意力机制，按照所述预设分配参数将多头注意力机制的头部数量进行分组，得到所述第一分辨率注意力机制的特征数量和所述第二分辨率注意力机制的特征数量；按照所述第一分辨率注意力机制的特征数量，从所述待测图像的全部特征中确定所述局部特征集合；按照所述第二分辨率注意力机制的特征数量，从所述待测图像的全部特征中确定所述全局特征集合。5.根据权利要求1所述的方法，其中，所述利用控制点定位网络对所述第一特征图像进行校正处理，得到第二特征图像，包括：从所述控制点定位网络获取预测基准点集合；根据所述预测基准点集合生成校正参数曲线和采样网络；利用所述采样网络对所述第一特征图像进行采样，得到控制点集合；利用所述校正参数曲线对所述控制点集合进行校正处理，得到所述第二特征图像。6.根据权利要求5所述的方法，其中，所述控制点集合中包括n个控制点，所述利用所述校正参数曲线对所述控制点集合进行校正处理，得到所述第二特征图像，包括：针对第i个控制点，根据所述控制点的坐标信息和所述校正参数曲线，确定目标偏移量；根据所述控制点的坐标信息和所述目标偏移量，确定所述控制点在校正之后...

【专利技术属性】
技术研发人员：冯如，冒卜颖，王茹楠，杨晓诚，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人