基于联邦OCR模型的字符检测方法、装置、设备和介质制造方法及图纸

技术编号：24855444 阅读：23 留言：0更新日期：2020-07-10 19:08

本发明专利技术涉及金融科技领域，并公开了一种基于联邦OCR模型的字符检测方法、装置、设备和介质。方法包括：在接收到OCR识别请求时，获取所述OCR识别请求关联的待识别的图像信息；调用联邦OCR模型对所述图像信息进行字符检测，获得OCR识别结果并输出，其中，所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得，所述联合梯度是协调端基于多方节点的模型梯度处理生成。本发明专利技术通过调用联邦OCR模型提高了OCR的准确率，避免隐私数据泄漏，提高了数据安全性。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦OCR模型的字符检测方法、装置、设备和介质
本专利技术涉及金融科技(Fintech)
，尤其涉及基于联邦OCR模型的字符检测方法、装置、设备和介质。
技术介绍
近年来，互联网金融科技(Fintech)的飞速发展，越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域。金融领域为了保证金融业务操作的安全性，需要用户上传证件照片信息，以供金融业务人员进行身份核对，当前主要是通过人工查看证件照片信息进行身份核对，这样的身份核对方式人力资源浪费严重；金融领域中部分金融机构采用OCR(OpticalCharacterRecognition，光学字符识别，即，将图片、照片上的文字内容，直接转换为可编辑文本)技术进行身份核对，OCR技术的引入，虽然减少了人力资源的浪费，但是当前OCR技术中的识别模型没有进行充分学习，导致OCR识别准确率低。
技术实现思路
本专利技术的主要目的在于提出一种基于联邦OCR模型的字符检测方法、装置、设备和介质，旨在解决当前OCR识别准确率较低的技术问题。为实现上述目的，本专利技术提供一种基于联邦OCR模型的字符检测方法，所述基于联邦OCR模型的字符检测方法包括如下步骤：在接收到OCR识别请求时，获取所述OCR识别请求关联的待识别的图像信息；调用联邦OCR模型对所述图像信息进行字符检测，获得OCR识别结果并输出，其中，所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得，所述联合梯度...

【技术保护点】
1.一种基于联邦OCR模型的字符检测方法，其特征在于，所述基于联邦OCR模型的字符检测方法包括如下步骤：/n在接收到OCR识别请求时，获取所述OCR识别请求关联的待识别的图像信息；/n调用联邦OCR模型对所述图像信息进行字符检测，获得OCR识别结果并输出，其中，所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得，所述联合梯度是协调端基于多方节点的模型梯度处理生成。/n

【技术特征摘要】
1.一种基于联邦OCR模型的字符检测方法，其特征在于，所述基于联邦OCR模型的字符检测方法包括如下步骤：
在接收到OCR识别请求时，获取所述OCR识别请求关联的待识别的图像信息；
调用联邦OCR模型对所述图像信息进行字符检测，获得OCR识别结果并输出，其中，所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得，所述联合梯度是协调端基于多方节点的模型梯度处理生成。

2.如权利要求1所述的基于联邦OCR模型的字符检测方法，其特征在于，在接收到OCR识别请求时，获取所述OCR识别请求关联的待识别的图像信息之前，所述方法还包括：
将本地存储中的图像信息进行标记形成训练样本集，从所述训练样本集中抽取预设比例的训练样本；
通过所述训练样本训练初始OCR模型，获得模型梯度，并将所述模型梯度发送至协调端，以使所述协调端基于多方节点反馈的模型梯度，生成联合梯度；
接收所述协调端发送的联合梯度，根据所述联合梯度更新所述初始OCR模型，得到训练后的OCR模型，获取训练后的OCR模型的OCR特征向量；
通过预设损失函数处理所述OCR特征向量，获得损失值，将所述损失值发送至协调端，以通过所述协调端分析所述损失值确定OCR模型是否训练完成；
在接收到所述协调端发送的训练完成提示时，将训练得到的OCR模型作为联邦OCR模型。

3.如权利要求1所述的基于联邦OCR模型的字符检测方法，其特征在于，所述调用联邦OCR模型对所述图像信息进行字符检测，获得OCR识别结果并输出的步骤，包括：
调用联邦OCR模型对所述图像信息进行文本检测，提取所述图像信息中的文本区域；
通过所述联邦OCR模型对所述文本区域进行文字识别，获得所述文本区域中包含的字符信息，将所述字符信息作为OCR识别结果并输出。

4.如权利要求3所述的基于联邦OCR模型的字符检测方法，其特征在于，所述通过所述联邦OCR模型对所述文本区域进行文字识别，获得所述文本区域中包含的字符信息，将所述字符信息作为OCR识别结果并输出的步骤，包括：
通过所述联邦OCR模型对所述文本区域进行文字识别，确定所述文本区域中字符的字符类型；
获取所述联邦OCR模型中所述字符类型对应的字符检测子模型，通过所述字符检测子模型对所述文本区域进行文字识别，获得所述文本区域中包含的字符信息，将所述字符信息作为OCR识别结果并输出。

5.如权利要求1所述的基于联邦OCR模型的字符检测方法，其特征在于，所述调用联邦OCR模型对所述图像信息进行字符检测，获得OCR识别结果并输出的步骤之后，包括：
在所述OCR识别结果...

【专利技术属性】
技术研发人员：章放，邹雨晗，杨海军，徐倩，杨强，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人