一种身份证OCR识别方法及系统技术方案

技术编号：44855491 阅读：4 留言：0更新日期：2025-04-01 19:48

本发明专利技术涉及一种身份证OCR识别方法及系统，该方法包括：获取多张OCR识别成功的身份证照片，进行不同程度的模糊化处理，构成训练集；基于训练集数据，通过深度学习算法对锐化参数进行训练优化，得到优化后的锐化参数；获取用户上传的身份证照片，根据优化后的锐化参数，对身份证照片进行USM锐化处理，将锐化后的身份证照片发送至OCR识别系统，进行身份证信息的识别。本发明专利技术通过USM锐化算法对身份证照片进行前置处理，显著增强了照片中的文字部分，使得OCR系统能够更准确地识别身份证上的信息。实验结果表明，经过前置处理的模糊照片识别成功率从12.1％提升至56.6％，验证了本发明专利技术的有效性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及图像处理与光学字符识别，尤其涉及一种身份证ocr识别方法及系统。

技术介绍

1、在消费金融机构中，客户身份验证是业务流程中的关键环节。为了高效、准确地完成这一步骤，客户上传身份证照片后进行ocr(optical character recognition，光学字符识别)识别已成为行业标准。这一流程不仅简化了客户操作，也大大提高了金融机构的工作效率。然而，在实际应用中，由于多种原因，如拍摄环境、设备质量、用户操作等，导致上传的身份证照片质量参差不齐，尤其是模糊、字迹不清的问题尤为突出。

2、目前，针对身份证照片的ocr识别，大多数金融机构采用的是传统的ocr技术。这种技术对于清晰、高质量的照片具有较好的识别效果，能够准确提取照片中的文字信息，如姓名、身份证号码、地址等。然而，当面对模糊、字迹不清的照片时，传统ocr技术的识别效率和效果会大幅下降，甚至无法识别。为了提高ocr识别的准确率，一些机构尝试在识别前对照片进行清晰化处理。例如，采用类似msaa(multisample anti-aliasing，多重采样抗锯齿)的实时渲染高清化技术，或者应用超分辨率采样技术来增强照片的清晰度。然而，这些技术往往需要大量的训练成本和训练集，且对于特定类型的模糊(如对焦不准、反光等)可能效果不佳。

技术实现思路

1、有鉴于此，有必要提供一种身份证ocr识别方法及系统，用以解决现有技术的上述缺陷。

2、为了解决上述问题，第一方面，本专利技术实施例提供一种身份证ocr识别方法，包括：

3、获取多张ocr识别成功的身份证照片，进行不同程度的模糊化处理，构成训练集；

4、基于训练集数据，通过深度学习算法对锐化参数进行训练优化，得到优化后的锐化参数；

5、获取用户上传的身份证照片，根据优化后的锐化参数，对身份证照片进行usm锐化处理，将锐化后的身份证照片发送至ocr识别系统，进行身份证信息的识别。

6、优选的，该方法还包括：

7、获取多张在生产环境中ocr识别失败的身份证照片作为验证集，使用验证集对优化后的锐化算法和ocr识别系统进行测试。

8、优选的，所述基于训练集通过深度学习算法对锐化参数进行训练优化，得到优化后的锐化参数，具体包括：

9、初始化锐化算法的参数，并对训练集中的模糊照片进行锐化处理；其中，锐化算法的参数包括amount、radius和threshold；

10、将锐化处理后的照片发送至ocr识别系统，获取识别结果；

11、通过比较识别结果与真实结果，计算交叉熵损失函数，并通过梯度下降算法优化参数值；

12、经过多次迭代训练，当损失函数达到最小值或收敛时，得到优化后的锐化参数。

13、优选的，所述交叉熵损失函数的表达式为：

14、

15、式中，ce(x)为交叉熵损失函数值；p(xi)为第i个类别的实际概率，q(xi)为第i个类别的预测概率，n表示类别总数。

16、优选的，所述深度学习算法为前馈神经网络算法。

17、优选的，所述根据优化后的锐化参数，对身份证照片进行usm锐化处理，包括：

18、使用通过深度学习算法训练得到的最佳锐化参数，通过usm算法对身份证照片进行前期处理，以增强身份证照片的高频部分，凸显文字部分。

19、优选的，所述usm算法的表达式为：

20、y(n，m)＝x(n，m)+λz(n，m)

21、式中，x(n，m)为输入图像，y(n，m)为输出图像，z(n，m)为校正信号，n和m分别表示图像的行和列索引，λ是用于控制增强效果的缩放因子。

22、第二方面，本专利技术实施例提供一种身份证ocr识别系统，包括：

23、训练集构建模块，用于获取多张ocr识别成功的身份证照片，进行不同程度的模糊化处理，构成训练集；

24、参数训练优化模块，用于基于训练集数据，通过深度学习算法对锐化参数进行训练优化，得到优化后的锐化参数；

25、ocr识别模块，用于获取用户上传的身份证照片，根据优化后的锐化参数，对身份证照片进行usm锐化处理，将锐化后的身份证照片发送至ocr识别系统，进行身份证信息的识别。

26、第三方面，本专利技术还提供了一种电子设备，包括存储器和处理器，其中，

27、所述存储器，用于存储程序；

28、所述处理器，与所述存储器耦合，用于执行所述存储器中存储的所述程序，以实现如本专利技术第一方面实施例所述的身份证ocr识别方法中的步骤。

29、第四方面，本专利技术还提供了一种计算机可读存储介质，用于存储计算机可读取的程序或指令，所述程序或指令被处理器执行时能够实现如本专利技术第一方面实施例所述的身份证ocr识别方法中的步骤。

30、本专利技术提供的身份证ocr识别方法及系统，与现有技术相比，具有以下有益效果：

31、1)本专利技术通过usm锐化算法对身份证照片进行前置处理，显著增强了照片中的文字部分，使得ocr系统能够更准确地识别身份证上的信息。usm算法通过增强图像的高频部分，有效提升了图像的视觉效果，使得原本模糊的文字变得更为清晰，为ocr识别提供了更好的输入条件。实验结果表明，经过前置处理的模糊照片识别成功率从12.1％提升至56.6％，验证了本专利技术的有效性。

32、2)本专利技术通过深度学习算法对锐化参数进行训练优化，经过优化后的锐化参数能够更有效地增强身份证照片中文字部分的清晰度，使得ocr系统能够更准确地识别照片中的信息。由于身份证照片在实际应用中可能因各种原因(如镜头对焦、反光、照片位置等)导致模糊，优化后的锐化参数能够更好地适应这些不同情况，提高系统对模糊照片的识别能力。

本文档来自技高网...

【技术保护点】

1.一种身份证OCR识别方法，其特征在于，包括：

2.根据权利要求1所述的身份证OCR识别方法，其特征在于，还包括：

3.根据权利要求1所述的身份证OCR识别方法，其特征在于，所述基于训练集通过深度学习算法对锐化参数进行训练优化，得到优化后的锐化参数，具体包括：

4.根据权利要求3所述的身份证OCR识别方法，其特征在于，所述交叉熵损失函数的表达式为：

5.根据权利要求1所述的身份证OCR识别方法，其特征在于，所述深度学习算法为前馈神经网络算法。

6.根据权利要求1所述的身份证OCR识别方法，其特征在于，所述根据优化后的锐化参数，对身份证照片进行USM锐化处理，包括：

7.根据权利要求6所述的身份证OCR识别方法，其特征在于，所述USM算法的表达式为：

8.一种应用于权利要求1-7任一项所述身份证OCR识别方法的身份证OCR识别系统，其特征在于，包括：

9.一种电子设备，其特征在于，包括存储器和处理器，其中，

10.一种计算机可读存储介质，其特征在于，用于存储计算机可读取的程

...

【技术特征摘要】

1.一种身份证ocr识别方法，其特征在于，包括：

2.根据权利要求1所述的身份证ocr识别方法，其特征在于，还包括：

3.根据权利要求1所述的身份证ocr识别方法，其特征在于，所述基于训练集通过深度学习算法对锐化参数进行训练优化，得到优化后的锐化参数，具体包括：

4.根据权利要求3所述的身份证ocr识别方法，其特征在于，所述交叉熵损失函数的表达式为：

5.根据权利要求1所述的身份证ocr识别方法，其特征在于，所述深度学习算法为前馈神经网络算法。

6.根据权利要求1所述的身份证ocr识别方...

【专利技术属性】
技术研发人员：张炳国，沈子航，李霄友，赵霄鹏，邓志伟，
申请(专利权)人：苏银凯基消费金融有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人