System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 票据信息的确定方法和装置、存储介质及电子设备制造方法及图纸_技高网

票据信息的确定方法和装置、存储介质及电子设备制造方法及图纸

技术编号:42490382 阅读:7 留言:0更新日期:2024-08-21 13:07
本申请公开了一种票据信息的确定方法和装置、存储介质及电子设备。涉及数据处理技术领域、金融科技领域及其他相关技术领域,该方法包括:确定目标票据图片的票据类型和多个票据元素;依据票据类型对目标票据图片进行处理,得到每个票据元素对应的票据子图片;通过目标检测模型的位置识别层对每张票据子图片进行检测,得到每个票据元素对应的位置信息;通过目标检测模型的文字识别层基于位置信息对每张票据子图片进行识别,得到目标票据图片的目标票据信息。通过本申请,解决了相关技术中通过在模型数据库中选择与票据类型相对应的目标检测模型来实现对不同类型的票据图片的信息提取,导致对票据信息的提取效率比较低的问题。

【技术实现步骤摘要】

本申请涉及数据处理、金融科技领域及其他相关,具体而言,涉及一种票据信息的确定方法和装置、存储介质及电子设备


技术介绍

1、金融机构每日都会处理大量的纸质票据业务,例如:汇款单、进账单和公司走账等。为了方便信息处理,网点前台及后台工作人员需要将票据信息高效、准确地录入数据处理系统中。传统方法中,工作人员通常会在模型数据库中选择与票据类型相对应的目标检测模型来实现对不同类型的票据图片的信息提取,但该方法事先需要进行大量的样本标注,人工成本高且项目周期长,如果涉及的票据类型较多,检测效率也会降低。

2、针对相关技术中通过在模型数据库中选择与票据类型相对应的目标检测模型来实现对不同类型的票据图片的信息提取,导致对票据信息的提取效率比较低的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请的主要目的在于提供一种票据信息的确定方法和装置、存储介质及电子设备,以解决相关技术中通过在模型数据库中选择与票据类型相对应的目标检测模型来实现对不同类型的票据图片的信息提取,导致对票据信息的提取效率比较低的问题。

2、为了实现上述目的,根据本申请的一个方面,提供了一种票据信息的确定方法。该方法包括:确定目标票据图片的票据类型和多个票据元素,其中,所述多个票据元素至少包括:开票账号、开票日期和票据金额;依据所述票据类型对所述目标票据图片进行处理,得到每个票据元素对应的票据子图片;通过目标检测模型的位置识别层对每张票据子图片进行检测,得到每个票据元素对应的位置信息;通过所述目标检测模型的文字识别层基于所述位置信息对每张票据子图片进行识别,得到所述目标票据图片的目标票据信息。

3、进一步地,依据所述票据类型对所述目标票据图片进行处理,得到每个票据元素对应的票据子图片包括:依据所述票据类型,确定每个票据元素对应的第一裁剪区域;依据所述第一裁剪区域和预设的扩大比例值进行计算,得到每个票据元素对应的第二裁剪区域,其中,所述第二裁剪区域的区域面积大于所述第一裁剪区域的区域面积;依据所述第二裁剪区域对所述目标票据图片进行裁剪,得到每个票据元素对应的票据子图片。

4、进一步地,通过目标检测模型的位置识别层对每张票据子图片进行检测,得到每个票据元素对应的位置信息包括:通过所述位置识别层中的卷积层对每张票据子图片进行特征提取,得到每张票据子图片对应的特征图;通过所述位置识别层中的激活函数层对所述特征图进行处理,得到每张票据子图片对应的阈值图、概率图和内容图,其中,所述阈值图用于标识每张票据子图片的文本区域与非文本区域,所述概率图用于标识每张票据子图片中的每个像素点属于文本的概率,所述内容图用于标识每张票据子图片中待识别的区域;通过所述位置识别层的计算层对所述阈值图、所述概率图和所述内容图进行计算,得到每张票据子图片对应的二值图像;通过所述位置识别层的循环神经网络层对所述二值图像进行处理,得到每个票据元素对应的位置信息。

5、进一步地,通过所述位置识别层中的激活函数层对所述特征图进行处理,得到每张票据子图片对应的阈值图、概率图和内容图包括:依据所述特征图进行识别,得到所述内容图;依据所述特征图对每张票据子图片中的文字信息进行框选,得到每张票据子图片对应的第一区域信息;依据第一尺寸信息对所述第一区域信息进行扩张处理得到第二区域信息,和依据第二尺寸信息对所述第一区域信息进行收缩处理得到第三区域信息;依据所述第二区域信息、所述第三区域信息和每张票据子图片,得到所述阈值图和所述概率图。

6、进一步地,依据所述第二区域信息、所述第三区域信息和每张票据子图片,得到所述阈值图和所述概率图包括:计算每张票据子图片中的每个像素点到所述第二区域信息的距离,得到目标距离值;依据所述目标距离值和每张票据子图片,确定所述阈值图;依据所述第三区域信息,确定每张票据子图片中的每个像素点对应的文本概率值;依据所述文本概率值和每张票据子图片,确定所述概率图。

7、进一步地,通过所述位置识别层的循环神经网络层对所述二值图像进行处理,得到每个票据元素对应的位置信息包括:对所述二值图像中的每个像素点进行连通性分析,得到连通区域信息;依据所述连通区域信息进行计算,得到每个票据元素对应的文字区域边界框;依据所述文字区域边界框,确定每个票据元素对应的位置信息。

8、进一步地,通过所述目标检测模型的文字识别层基于所述位置信息对每张票据子图片进行识别,得到所述目标票据图片的目标票据信息包括:依据每个票据元素对应的位置信息,对每张票据子图片进行文字识别,得到每张票据子图片对应的文字内容;判断每张票据子图片对应的文字内容是否存在错误,得到判断结果;若所述判断结果表征每张票据子图片对应的文字内容不存在错误,则依据每张票据子图片对应的文字内容,确定所述目标票据信息。

9、为了实现上述目的,根据本申请的另一方面,提供了一种票据信息的确定装置。该装置包括:确定单元,用于确定目标票据图片的票据类型和多个票据元素,其中,所述多个票据元素至少包括:开票账号、开票日期和票据金额;处理单元,用于依据所述票据类型对所述目标票据图片进行处理,得到每个票据元素对应的票据子图片;检测单元,用于通过目标检测模型的位置识别层对每张票据子图片进行检测,得到每个票据元素对应的位置信息;识别单元,用于通过所述目标检测模型的文字识别层基于所述位置信息对每张票据子图片进行识别,得到所述目标票据图片的目标票据信息。

10、进一步地,处理单元包括:第一确定模块,用于依据所述票据类型,确定每个票据元素对应的第一裁剪区域;第一计算模块,用于依据所述第一裁剪区域和预设的扩大比例值进行计算,得到每个票据元素对应的第二裁剪区域,其中,所述第二裁剪区域的区域面积大于所述第一裁剪区域的区域面积;裁剪模块,用于依据所述第二裁剪区域对所述目标票据图片进行裁剪,得到每个票据元素对应的票据子图片。

11、进一步地,检测单元包括:特征提取模块,用于通过所述位置识别层中的卷积层对每张票据子图片进行特征提取,得到每张票据子图片对应的特征图;第一处理模块,用于通过所述位置识别层中的激活函数层对所述特征图进行处理,得到每张票据子图片对应的阈值图、概率图和内容图,其中,所述阈值图用于标识每张票据子图片的文本区域与非文本区域,所述概率图用于标识每张票据子图片中的每个像素点属于文本的概率,所述内容图用于标识每张票据子图片中待识别的区域;第二计算模块,用于通过所述位置识别层的计算层对所述阈值图、所述概率图和所述内容图进行计算,得到每张票据子图片对应的二值图像;第二处理模块,用于通过所述位置识别层的循环神经网络层对所述二值图像进行处理,得到每个票据元素对应的位置信息。

12、进一步地,第一处理模块包括:识别子模块,用于依据所述特征图进行识别,得到所述内容图;框选子模块,用于依据所述特征图对每张票据子图片中的文字信息进行框选,得到每张票据子图片对应的第一区域信息;扩缩子模块,用于依据第一尺寸信息对所述第一区域信息进行扩张处理得到第二区域信息,和本文档来自技高网...

【技术保护点】

1.一种票据信息的确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,依据所述票据类型对所述目标票据图片进行处理,得到每个票据元素对应的票据子图片包括:

3.根据权利要求1所述的方法,其特征在于,通过目标检测模型的位置识别层对每张票据子图片进行检测,得到每个票据元素对应的位置信息包括:

4.根据权利要求3所述的方法,其特征在于,通过所述位置识别层中的激活函数层对所述特征图进行处理,得到每张票据子图片对应的阈值图、概率图和内容图包括:

5.根据权利要求4所述的方法,其特征在于,依据所述第二区域信息、所述第三区域信息和每张票据子图片,得到所述阈值图和所述概率图包括:

6.根据权利要求3所述的方法,其特征在于,通过所述位置识别层的循环神经网络层对所述二值图像进行处理,得到每个票据元素对应的位置信息包括:

7.根据权利要求1所述的方法,其特征在于,通过所述目标检测模型的文字识别层基于所述位置信息对每张票据子图片进行识别,得到所述目标票据图片的目标票据信息包括:

8.一种票据信息的确定装置,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质在设备执行权利要求1至7中任意一项所述的票据信息的确定方法。

10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的票据信息的确定方法。

...

【技术特征摘要】

1.一种票据信息的确定方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,依据所述票据类型对所述目标票据图片进行处理,得到每个票据元素对应的票据子图片包括:

3.根据权利要求1所述的方法,其特征在于,通过目标检测模型的位置识别层对每张票据子图片进行检测,得到每个票据元素对应的位置信息包括:

4.根据权利要求3所述的方法,其特征在于,通过所述位置识别层中的激活函数层对所述特征图进行处理,得到每张票据子图片对应的阈值图、概率图和内容图包括:

5.根据权利要求4所述的方法,其特征在于,依据所述第二区域信息、所述第三区域信息和每张票据子图片,得到所述阈值图和所述概率图包括:

6.根据权利要求3所述的方法,其特征在于,通过所述位置识别层的循环神经网络层...

【专利技术属性】
技术研发人员:张亚许政伟廖航英
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1