光学字符识别模型的评估方法、装置以及电子设备制造方法及图纸

技术编号：42511700 阅读：4 留言：0更新日期：2024-08-27 19:27

本申请公开了一种光学字符识别模型的评估方法、装置以及电子设备。该方法包括：将测试图像输入目标光学字符识别OCR模型，获得目标OCR模型输出的测试图像中的识别文本，以及识别文本的文本框位置；若测试文本的文本框位置与识别文本的文本框位置的重合度大于重合度阈值，则计算识别文本的字符串与测试文本的字符串之间的编辑距离；基于编辑距离获得目标OCR模型的识别准确率，进而通过结合模型输出的识别文本的文本框选准确率和识别文本与测试文本之间的编辑距离评估模型，提高了模型评估的全面性和代表性。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及图像识别，更具体地，涉及一种光学字符识别模型的评估方法、装置以及电子设备。

技术介绍

1、随着科学技术的发展，图像识别
提出了光学字符识别(opticalcharacter recognition，ocr)技术，其中，ocr技术能够将图像中印刷文字转换为计算机可处理的文本格式。而随着大数据和深度学习技术的不断发展，ocr技术取得了突破性的进展，ocr模型的使用也越来越广泛。因此，相关技术中，对ocr模型性能的评估存在越来越全面的要求。

技术实现思路

1、鉴于上述问题，本申请提出了一种光学字符识别模型的评估方法、装置、电子设备以及存储介质，可以通过结合模型输出的识别文本的文本框选准确率和识别文本与测试文本之间的编辑距离评估模型，提高了模型评估的全面性和代表性。

2、第一方面，本申请实施例提供了一种光学字符识别模型的评估方法，所述方法包括：获取测试图像集，其中，所述测试图像集中包括多张测试图像以及各所述测试图像对应的标注文本，各所述测试图像对应的标注文本包括各所述测试图像中包括的测试文本以及所述测试文本的文本框位置；将所述测试图像输入目标光学字符识别ocr模型，获得所述目标ocr模型输出的所述测试图像中的识别文本，以及所述识别文本的文本框位置；若所述测试文本的文本框位置与所述识别文本的文本框位置的重合度大于重合度阈值，则计算所述识别文本的字符串与所述测试文本的字符串之间的编辑距离；基于所述编辑距离获得所述目标ocr模型的识别准确率。

3、第二方面

4、第三方面，本申请实施例提供了一种电子设备，包括存储器和处理器，所述存储器耦接到所述处理器，所述存储器存储指令，当所述指令由所述处理器执行时所述处理器执行上述方法。

5、第四方面，本申请实施例提供了一种计算机可读取存储介质，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行上述方法。

6、本申请实施例提供的光学字符识别模型的评估方法、装置、电子设备以及存储介质，通过获取测试图像集，其中，测试图像集中包括多张测试图像以及各测试图像对应的标注文本，各测试图像对应的标注文本包括各测试图像中包括的测试文本以及测试文本的文本框位置；将测试图像输入目标光学字符识别ocr模型，获得目标ocr模型输出的测试图像中的识别文本，以及识别文本的文本框位置；若测试文本的文本框位置与识别文本的文本框位置的重合度大于重合度阈值，则计算识别文本的字符串与测试文本的字符串之间的编辑距离；基于编辑距离获得目标ocr模型的识别准确率，进而通过结合模型输出的识别文本的文本框选准确率和识别文本与测试文本之间的编辑距离评估模型，提高了模型评估的全面性和代表性。

本文档来自技高网...

【技术保护点】

1.一种光学字符识别模型的评估方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述测试图像输入目标光学字符识别OCR模型，获得所述目标OCR模型输出的所述测试图像中的识别文本，以及所述识别文本的文本框位置，包括：

3.根据权利要求1所述的方法，其特征在于，在所述若所述测试文本的文本框位置与所述识别文本的文本框位置的重合度大于重合度阈值，则计算所述识别文本的字符串与所述测试文本的字符串之间的编辑距离之前，还包括：

4.根据权利要求3所述的方法，其特征在于，所述文本格式合法，包括：

5.根据权利要求1所述的方法，其特征在于，所述测试文本的文本框位置的数量为至少一个，所述识别文本的文本框位置的数量为至少一个，所述若所述测试文本的文本框位置与所述识别文本的文本框位置的重合度大于重合度阈值，则计算所述识别文本的字符串与所述测试文本的字符串之间的编辑距离，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于至少一个所述测试文本的文本框位置，确定所述测试文本的目标文本框位置，包括：

8.根据权利要求1-7任一项所述的方法，其特征在于，所述计算所述识别文本的字符串与所述测试文本的字符串之间的编辑距离，包括：

9.根据权利要求8所述的方法，其特征在于，所述基于所述编辑距离获得所述目标OCR模型的识别准确率，包括：

10.根据权利要求8所述的方法，其特征在于，所述方法还包括：

11.根据权利要求10所述的方法，其特征在于，所述基于所述编辑距离获得所述目标OCR模型的召回率，包括：

12.一种光学字符识别模型的评估装置，其特征在于，所述装置包括：

13.一种电子设备，其特征在于，包括：

14.一种计算机可读取存储介质，其特征在于，所述计算机可读取存储介质中存储有程序代码，所述程序代码可被处理器调用执行如权利要求1-11任一项所述的方法。

...

【技术特征摘要】

1.一种光学字符识别模型的评估方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述测试图像输入目标光学字符识别ocr模型，获得所述目标ocr模型输出的所述测试图像中的识别文本，以及所述识别文本的文本框位置，包括：

4.根据权利要求3所述的方法，其特征在于，所述文本格式合法，包括：

6.根据权利要求5所述的方法，其特征在于，所述基于至少一个所述测试文本的文本...

【专利技术属性】
技术研发人员：刘云霞，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人