一种文本图像识别方法、装置、电子设备及存储介质制造方法及图纸

技术编号：40472071 阅读：15 留言：0更新日期：2024-02-26 19:09

本发明专利技术公开了一种文本图像识别方法、装置、电子设备及存储介质。该方法包括：获取待识别文本图像；其中，所述待识别文本图像包括至少一种文本属性的文本信息；基于位置‑属性检测模型对所述待识别文本图像进行检测，得到文本位置信息和所述文本位置信息对应的文本属性；对所述待识别文本图像中所述文本位置信息对应的文本区域进行识别，得到文本内容，基于所述文本内容和所述文本属性确定结构化的文本内容。本发明专利技术将文本信息的文本位置检测和文本属性判别融合到同一模型中，简化处理流程，解决现有技术因此整体处理流程较多导致文本图像的效率较低的问题，提高文本图像的识别效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及文本识别，尤其涉及一种文本图像识别方法、装置、电子设备及存储介质。

技术介绍

1、近年来，随着光学字符识别(optical character recognition，ocr)相关技术的不断发展，在快递包裹面单、财务报销发票、电子表格数据等邮政相关业务场景，存在广泛的应用需求。

2、目前，现有的技术基本采用ocr识别、内容结构化相融合的技术策略，整体包括三个核心步骤：文本检测、文本识别、文本内容结构化。然而，现有的方案因此整体处理流程较多导致文本图像的效率较低。

技术实现思路

1、本专利技术提供了一种文本图像识别方法、装置、电子设备及存储介质，以解决现有技术因此整体处理流程较多导致文本图像的效率较低的问题。

2、根据本专利技术的一方面，提供了一种文本图像识别方法，包括：

3、获取待识别文本图像；其中，所述待识别文本图像包括至少一种文本属性的文本信息；

4、基于位置-属性检测模型对所述待识别文本图像进行检测，得到文本位置信息和所述文本位置信息对应的文本属性；

5、对所述待识别文本图像中所述文本位置信息对应的文本区域进行识别，得到文本内容，基于所述文本内容和所述文本属性确定结构化的文本内容。

6、根据本专利技术的另一方面，提供了一种文本图像识别装置，包括：

7、待识别文本图像获取模块，用于获取待识别文本图像；其中，所述待识别文本图像包括至少一种文本属性的文本信息；

8、位置-属

9、结构化的文本内容确定模块，用于对所述待识别文本图像中所述文本位置信息对应的文本区域进行识别，得到文本内容，基于所述文本内容和所述文本属性确定结构化的文本内容。

10、根据本专利技术的另一方面，提供了一种电子设备，所述电子设备包括：

11、至少一个处理器；以及

12、与所述至少一个处理器通信连接的存储器；其中，

13、所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本专利技术任一实施例所述的文本图像识别方法。

14、根据本专利技术的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的文本图像识别方法。

15、本专利技术实施例的技术方案，通过获取待识别文本图像；其中，待识别文本图像包括至少一种文本属性的文本信息；基于位置-属性检测模型对待识别文本图像进行检测，得到文本位置信息和文本位置信息对应的文本属性；对待识别文本图像中文本位置信息对应的文本区域进行识别，得到文本内容，基于文本内容和文本属性确定结构化的文本内容。将文本信息的文本位置检测和文本属性判别融合到同一模型中，简化处理流程，解决现有技术因此整体处理流程较多导致文本图像的效率较低的问题，提高文本图像的识别效率。

16、应当理解，本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征，也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种文本图像识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述位置-属性检测模型包括文本位置检测分支和文本属性判别分支；所述位置-属性检测模型的训练方法，包括：

3.根据权利要求2所述的方法，其特征在于，所述获取样本文本图像，包括：

4.根据权利要求2所述的方法，其特征在于，所述基于所述文本位置损失和所述文本属性损失对所述预先构建的位置-属性检测模型进行更新之前，所述方法还包括：

5.根据权利要求2所述的方法，其特征在于，所述标注文本位置包括所包括文本区域的中心点的坐标以及所述文本区域对应文本检测框的坐标参数和长宽比。

6.根据权利要求1所述的方法，其特征在于，所述对所述待识别文本图像中所述文本位置信息对应的文本区域进行识别，得到文本内容，包括：

7.根据权利要求1所述的方法，其特征在于，所述获取待识别文本图像之后，所述方法还包括：

8.一种文本图像识别装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

10.一种计算机

...

【技术特征摘要】

1.一种文本图像识别方法，其特征在于，包括：

3.根据权利要求2所述的方法，其特征在于，所述获取样本文本图像，包括：

5.根据权利要求2所述的方法，其特征在于，所述标注文本位置包括所包括文本区域的中心点的坐标以及所述文本区域对...

【专利技术属性】
技术研发人员：朱浩，李丽，
申请(专利权)人：中邮信息科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人