System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及金融,尤其涉及一种凭证识别模型的更新构建方法、装置、设备及介质。
技术介绍
1、随着银行柜面电子化业务的全面覆盖,加强对运营操作风险的防范,保证事后监督质量变得尤为关键。
2、事后监督业务场景中存在着大量的凭证图片文字识别需求,当前主要依靠ocr要素识别与人工录入相结合的方式来实现。一方面,对于现金缴款单、进账单、支票、结算业务申请书等全国通用样式较为固定的凭证,采用ocr识别的方式完成事后监督录入工作。另一方面,对于业务场景不典型、适用范围小等收集样本难度较大的凭证,目前仍采取人工录入凭证样本的方式,不足以有效支撑业务的迅速发展。
技术实现思路
1、本专利技术提供了一种凭证识别模型的更新构建方法、装置、设备及介质,以解决凭证识别效率低下以及人工成本高的问题。
2、根据本专利技术的一方面,提供了一种凭证识别模型的更新构建方法,该方法包括:
3、获取至少一个凭证集合,并将所述凭证集合存入凭证样本库;其中,所述凭证集合用于存储相同凭证类型的重要凭证;
4、基于预先训练的凭证识别模型对所述凭证集合中的重要凭证的凭证图片进行识别得到凭证集合的图片识别率;其中,所述凭证识别模型中包括至少一个凭证识别子模型,用于对至少一种凭证类型的重要凭证的凭证图片进行识别;
5、在所述凭证集合的图片识别率满足模型更新条件的情况下,基于所述凭证样本库对凭证识别模型中所述凭证集合对应的凭证识别子模型进行更新;
6、在所述凭证集
7、根据本专利技术的另一方面,提供了一种凭证识别模型的更新构建装置,该装置包括:
8、集合获取模块,用于获取至少一个凭证集合,并将所述凭证集合存入凭证样本库;
9、识别率确定模块,用于基于预先训练的凭证识别模型对所述凭证集合中的重要凭证的凭证图片进行识别得到凭证集合的图片识别率;其中,所述凭证识别模型中包括至少一个凭证识别子模型,用于对至少一种凭证类型的重要凭证的凭证图片进行识别;
10、子模型更新模块,用于在所述凭证集合的图片识别率满足模型更新条件的情况下,基于所述凭证样本库对凭证识别模型中所述凭证集合对应的凭证识别子模型进行更新;
11、子模型建立模块,用于在所述凭证集合的图片识别率满足模型构建条件的情况下,基于所述凭证样本库在凭证识别模型中为所述凭证集合构建对应的凭证识别子模型
12、根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
13、至少一个处理器;以及
14、与所述至少一个处理器通信连接的存储器;其中,
15、所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的凭证识别模型的更新构建方法。
16、根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的凭证识别模型的更新构建方法。
17、本专利技术实施例的技术方案,通过构建凭证样本库,在凭证集合对应的图片识别率满足模型更新条件时,基于凭证样本库自动获取训练样本,对凭证识别模型中凭证集合对应的凭证识别子模型进行更新,在凭证集合对应的图片识别率满足模型构建条件时,基于凭证样本库自动获取训练样本构建凭证集合对应的凭证识别子模型,实现了自动化模型训练,提高了样本采集的效率、准确性以及样本数据的质量,避免了人工采集样本产生的数据泄露风险。
18、应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
本文档来自技高网...【技术保护点】
1.一种凭证识别模型的更新构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述在所述凭证集合的图片识别率满足模型更新条件的情况下,基于所述凭证样本库对凭证识别模型中所述凭证集合对应的凭证识别子模型进行更新,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述凭证样本库中读取所述凭证集合对应的预设数量的凭证样本,包括:
4.根据权利要求2所述的方法,其特征在于,所述凭证样本还包括凭证样本库中所述凭证集合对应的识别状态为识别失败的凭证图片。
5.根据权利要求2所述的方法,其特征在于,所述预设识别标准通过图片识别率、识别效率以及凭证样本的数量确定。
6.根据权利要求1所述的方法,其特征在于,所述在所述凭证集合的图片识别率满足模型构建条件的情况下,基于所述凭证样本库在凭证识别模型中为所述凭证集合构建对应的凭证识别子模型,包括:
7.根据权利要求1所述的方法,其特征在于,所述获取至少一个凭证集合,包括:
8.一种凭证识别模型的更新构建装置,其特征在于,包括:
9.
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-7中任一项所述的凭证识别模型的更新构建方法。
...【技术特征摘要】
1.一种凭证识别模型的更新构建方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述在所述凭证集合的图片识别率满足模型更新条件的情况下,基于所述凭证样本库对凭证识别模型中所述凭证集合对应的凭证识别子模型进行更新,包括:
3.根据权利要求2所述的方法,其特征在于,所述从所述凭证样本库中读取所述凭证集合对应的预设数量的凭证样本,包括:
4.根据权利要求2所述的方法,其特征在于,所述凭证样本还包括凭证样本库中所述凭证集合对应的识别状态为识别失败的凭证图片。
5.根据权利要求2所述的方法,其特征在于,所述预设识别标准通过图片识别率、识别效率以及凭证样...
【专利技术属性】
技术研发人员:范田,
申请(专利权)人:中国农业银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。