文字识别方法、装置、设备及存储介质制造方法及图纸

技术编号：41876851 阅读：19 留言：0更新日期：2024-07-02 00:29

本公开实施例提供了一种文字识别方法、装置、设备及存储介质。该方法包括：获取待识别的第一文字图像以及待识别的文字集合；文字集合包括每个文字对应的表意文字描述序列；将待识别的第一文字图像以及待识别的文字集合输入至预先训练的文本识别模型中，输出第一图像编码特征以及文本特征集合；文本特征集合包括每个表意文字描述序列对应的文本特征；文本识别模型包括预先训练的图像编码器以及预先训练的文本编码器；分别确定第一图像编码特征与文本特征集合中每个文本特征的相似度，获得多个相似度；基于多个相似度确定目标文本特征对应的目标文字，并将目标文字作为第一文字图像对应的文字。本公开实施例，可以提高文字识别的精度。

全部详细技术资料下载

【技术实现步骤摘要】

本公开实施例涉及计算机，尤其涉及一种文字识别方法、装置、设备及存储介质。

技术介绍

1、随着移动互联网和人工智能技术的快速发展，文档和卡证电子化采集和处理趋势日益明显，越来越多的文档或卡证通过智能手机拍摄采集后，送入后台通过光学字符识别(optical character recognition，ocr)，实现各种信息的自动录入，供后台业务人员进行快速审核。然而，现有ocr技术中，存在文字识别精度低的问题。

技术实现思路

1、本公开实施例提供一种文字识别方法、装置、设备及存储介质，可以提高文字识别的准确率。

2、第一方面，本公开实施例提供了一种文字识别方法，获取待识别的第一文字图像以及待识别的文字集合；其中，所述文字集合包括每个文字对应的表意文字描述序列；将所述待识别的第一文字图像以及所述待识别的文字集合输入至预先训练的文本识别模型中，输出第一图像编码特征以及文本特征集合；所述文本特征集合包括每个表意文字描述序列对应的文本特征；所述文本识别模型包括预先训练的图像编码器以及预先训练的文本编码器；分别确定所述第一图像编码特征与所述文本特征集合中每个文本特征的相似度，获得多个相似度；基于所述多个相似度确定目标文本特征对应的目标文字，并将所述目标文字作为所述第一文字图像对应的文字。

3、第二方面，本公开实施例还提供了一种文字识别装置，包括：获取模块，用于获取待识别的第一文字图像以及待识别的文字集合；其中，所述文字集合包括每个文字对应的表意文字描述序列；模型识别模块，

4、第三方面，本公开实施例还提供了一种电子设备，所述电子设备包括：

5、一个或多个处理器；

6、存储装置，用于存储一个或多个程序，

7、当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如本公开实施例所述的文字识别方法。

8、第四方面，本公开实施例还提供了一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如本公开实施例所述的文字识别方法。

9、本公开实施例的技术方案，获取待识别的第一文字图像以及待识别的文字集合；其中，所述文字集合包括每个文字对应的表意文字描述序列；将所述待识别的第一文字图像以及所述待识别的文字集合输入至预先训练的文本识别模型中，输出第一图像编码特征以及文本特征集合；所述文本特征集合包括每个表意文字描述序列对应的文本特征；所述文本识别模型包括预先训练的图像编码器以及预先训练的文本编码器；分别确定所述第一图像编码特征与所述文本特征集合中每个文本特征的相似度，获得多个相似度；基于所述多个相似度确定目标文本特征对应的目标文字，并将所述目标文字作为所述第一文字图像对应的文字。本公开实施例，通过文字识别模型结合文字集合对文字图像进行文字识别的方式，可以提高文字识别的精度。

本文档来自技高网...

【技术保护点】

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求1所述的方法，其特征在于，所述文本识别模型的训练方式为：

4.根据权利要求3所述的方法，其特征在于，从初始训练集中选择所述第一设定数量的第一样本对中表意文字描述序列对应的相似字，包括：

5.根据权利要求3所述的方法，其特征在于，基于第二设定数量的第五样本对以及第二设定数量的第六样本对对文本识别模型进行迭代训练，包括：

6.根据权利要求5所述的方法，其特征在于，第一损失函数的公式如下：

7.根据权利要求5所述的方法，其特征在于，第二损失函数的公式如下：

8.一种文字识别装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述电子设备包括：

10.一种包含计算机可执行指令的存储介质，所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的文字识别方法。

【技术特征摘要】

1.一种文字识别方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，还包括：

3.根据权利要求1所述的方法，其特征在于，所述文本识别模型的训练方式为：

4.根据权利要求3所述的方法，其特征在于，从初始训练集中选择所述第一设定数量的第一样本对中表意文字描述序列对应的相似字，包括：

5.根据权利要求3所述的方法，其特征在于，基于第二设定数量的第五样本对以及第二设定数量的第六样本对对文本识...

【专利技术属性】
技术研发人员：丁拥科，
申请(专利权)人：众安在线财产保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人