基于联邦OCR模型的字符检测方法、装置、设备和介质制造方法及图纸

技术编号:24855444 阅读:17 留言:0更新日期:2020-07-10 19:08
本发明专利技术涉及金融科技领域,并公开了一种基于联邦OCR模型的字符检测方法、装置、设备和介质。方法包括:在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息;调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出,其中,所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得,所述联合梯度是协调端基于多方节点的模型梯度处理生成。本发明专利技术通过调用联邦OCR模型提高了OCR的准确率,避免隐私数据泄漏,提高了数据安全性。

【技术实现步骤摘要】
基于联邦OCR模型的字符检测方法、装置、设备和介质
本专利技术涉及金融科技(Fintech)
,尤其涉及基于联邦OCR模型的字符检测方法、装置、设备和介质。
技术介绍
近年来,互联网金融科技(Fintech)的飞速发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域。金融领域为了保证金融业务操作的安全性,需要用户上传证件照片信息,以供金融业务人员进行身份核对,当前主要是通过人工查看证件照片信息进行身份核对,这样的身份核对方式人力资源浪费严重;金融领域中部分金融机构采用OCR(OpticalCharacterRecognition,光学字符识别,即,将图片、照片上的文字内容,直接转换为可编辑文本)技术进行身份核对,OCR技术的引入,虽然减少了人力资源的浪费,但是当前OCR技术中的识别模型没有进行充分学习,导致OCR识别准确率低。
技术实现思路
本专利技术的主要目的在于提出一种基于联邦OCR模型的字符检测方法、装置、设备和介质,旨在解决当前OCR识别准确率较低的技术问题。为实现上述目的,本专利技术提供一种基于联邦OCR模型的字符检测方法,所述基于联邦OCR模型的字符检测方法包括如下步骤:在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息;调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出,其中,所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得,所述联合梯度是协调端基于多方节点的模型梯度处理生成。可选地,在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息之前,所述方法还包括:将本地存储中的图像信息进行标记形成训练样本集,从所述训练样本集中抽取预设比例的训练样本;通过所述训练样本训练初始OCR模型,获得模型梯度,并将所述模型梯度发送至协调端,以使所述协调端基于多方节点反馈的模型梯度,生成联合梯度;接收所述协调端发送的联合梯度,根据所述联合梯度更新所述初始OCR模型,得到训练后的OCR模型,获取训练后的OCR模型的OCR特征向量;通过预设损失函数处理所述OCR特征向量,获得损失值,将所述损失值发送至协调端,以通过所述协调端分析所述损失值确定OCR模型是否训练完成;在接收到所述协调端发送的训练完成提示时,将训练得到的OCR模型作为联邦OCR模型。可选地,所述调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出的步骤,包括:调用联邦OCR模型对所述图像信息进行文本检测,提取所述图像信息中的文本区域;通过所述联邦OCR模型对所述文本区域进行文字识别,获得所述文本区域中包含的字符信息,将所述字符信息作为OCR识别结果并输出。可选地,所述通过所述联邦OCR模型对所述文本区域进行文字识别,获得所述文本区域中包含的字符信息,将所述字符信息作为OCR识别结果并输出的步骤,包括:通过所述联邦OCR模型对所述文本区域进行文字识别,确定所述文本区域中字符的字符类型;获取所述联邦OCR模型中所述字符类型对应的字符检测子模型,通过所述字符检测子模型对所述文本区域进行文字识别,获得所述文本区域中包含的字符信息,将所述字符信息作为OCR识别结果并输出。可选地,所述调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出的步骤之后,包括:在所述OCR识别结果错误时,输出标注提示,提示用户对所述图像信息进行标注;将标注之后的图像信息作为训练样本,根据所述训练样本训练所述联邦OCR模型获得模型梯度,并将所述模型梯度发送至协调端,以使所述协调端基于多方节点反馈的模型梯度,生成联合梯度;接收所述协调端发送的联合梯度,根据所述联合梯度更新所述联邦OCR模型。可选地,所述在所述OCR识别结果错误时,输出模型训练提示,提示用户对所述图像信息进行标注的步骤,包括:在所述OCR识别结果错误时,确定所述错误的错误类型;在所述错误类型为区域检测错误,则输出区域标注提示,以提示用户标注所述图像信息中的文本区域;在所述错误类型为文字识别错误,则输出文字标注提示,以提示用户输入所述图像信息中包含的字符信息。可选地,所述在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息的步骤之后,所述方法还包括:在所述图像信息为证件图像时,获取所述证件图像的证件类型;所述调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出的步骤,包括:调用所述证件类型对应的联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出。此外,为实现上述目的,本专利技术还提供一种基于联邦OCR模型的字符检测装置,所述基于联邦OCR模型的字符检测装置包括:请求接收模块,用于在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息;调用检测模块,用于调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出,其中,所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得,所述联合梯度是协调端基于多方节点的模型梯度处理生成。此外,为实现上述目的,本专利技术还提供一种基于联邦OCR模型的字符检测设备,所述基于联邦OCR模型的字符检测设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于联邦OCR模型的OCR识别对应的计算机程序,所述基于联邦OCR模型的OCR识别对应的计算机程序被所述处理器执行时实现如上所述的基于联邦OCR模型的字符检测方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于联邦OCR模型的OCR识别对应的计算机程序,所述基于联邦OCR模型的OCR识别对应的计算机程序被处理器执行时实现如上所述的基于联邦OCR模型的字符检测方法的步骤。本专利技术提供一种基于联邦OCR模型的字符检测方法、装置、设备和介质,本专利技术实施例中在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息;调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出,其中,所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得,所述联合梯度是协调端基于多方节点的模型梯度处理生成。本专利技术实施例中预先构建基于联邦OCR模型,联邦OCR模型是基于联盟链中多节点的模型梯度确定联合梯度,根据联合梯度联合训练得到的,联邦OCR模型使得多方能够在不泄露自己数据隐私的情况下充分学习,本实施例中通过联邦OCR模型对图像信息进行字符检测,提高了OCR识别的准确率。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的设备结构示意图;图2为本专利技术基于联邦OCR模型的字符检测方法第一实施例的流程示意图;图3为本专利技术基于联邦OCR模型的字符本文档来自技高网...

【技术保护点】
1.一种基于联邦OCR模型的字符检测方法,其特征在于,所述基于联邦OCR模型的字符检测方法包括如下步骤:/n在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息;/n调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出,其中,所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得,所述联合梯度是协调端基于多方节点的模型梯度处理生成。/n

【技术特征摘要】
1.一种基于联邦OCR模型的字符检测方法,其特征在于,所述基于联邦OCR模型的字符检测方法包括如下步骤:
在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息;
调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出,其中,所述联邦OCR模型为基于协调端发送的联合梯度对本地的初始OCR模型迭代训练获得,所述联合梯度是协调端基于多方节点的模型梯度处理生成。


2.如权利要求1所述的基于联邦OCR模型的字符检测方法,其特征在于,在接收到OCR识别请求时,获取所述OCR识别请求关联的待识别的图像信息之前,所述方法还包括:
将本地存储中的图像信息进行标记形成训练样本集,从所述训练样本集中抽取预设比例的训练样本;
通过所述训练样本训练初始OCR模型,获得模型梯度,并将所述模型梯度发送至协调端,以使所述协调端基于多方节点反馈的模型梯度,生成联合梯度;
接收所述协调端发送的联合梯度,根据所述联合梯度更新所述初始OCR模型,得到训练后的OCR模型,获取训练后的OCR模型的OCR特征向量;
通过预设损失函数处理所述OCR特征向量,获得损失值,将所述损失值发送至协调端,以通过所述协调端分析所述损失值确定OCR模型是否训练完成;
在接收到所述协调端发送的训练完成提示时,将训练得到的OCR模型作为联邦OCR模型。


3.如权利要求1所述的基于联邦OCR模型的字符检测方法,其特征在于,所述调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出的步骤,包括:
调用联邦OCR模型对所述图像信息进行文本检测,提取所述图像信息中的文本区域;
通过所述联邦OCR模型对所述文本区域进行文字识别,获得所述文本区域中包含的字符信息,将所述字符信息作为OCR识别结果并输出。


4.如权利要求3所述的基于联邦OCR模型的字符检测方法,其特征在于,所述通过所述联邦OCR模型对所述文本区域进行文字识别,获得所述文本区域中包含的字符信息,将所述字符信息作为OCR识别结果并输出的步骤,包括:
通过所述联邦OCR模型对所述文本区域进行文字识别,确定所述文本区域中字符的字符类型;
获取所述联邦OCR模型中所述字符类型对应的字符检测子模型,通过所述字符检测子模型对所述文本区域进行文字识别,获得所述文本区域中包含的字符信息,将所述字符信息作为OCR识别结果并输出。


5.如权利要求1所述的基于联邦OCR模型的字符检测方法,其特征在于,所述调用联邦OCR模型对所述图像信息进行字符检测,获得OCR识别结果并输出的步骤之后,包括:
在所述OCR识别结果...

【专利技术属性】
技术研发人员:章放邹雨晗杨海军徐倩杨强
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1