一种财务凭证信息自动识别方法技术

技术编号:29205791 阅读:17 留言:0更新日期:2021-07-10 00:41
本发明专利技术公开了一种财务凭证信息自动识别方法,图像分析模块对纸质财务凭证的图像信息进行图像特征信息提取,然后图像分析模块根据图像特征信息进行分析得到数据信息,数据信息进行电子化存储。本发明专利技术对于财务凭证存储记录不仅仅是做到了图像的存储,而且对于财务凭证的数据进行了数据化的存储,节约了人工成本,且减少了人工记录的误差,同时对于验证信息的识别进一步提高了识别的准确率。识别进一步提高了识别的准确率。识别进一步提高了识别的准确率。

【技术实现步骤摘要】
一种财务凭证信息自动识别方法


[0001]本专利技术涉及图像识别存储
,尤其是指一种财务凭证信息自动识别方法。

技术介绍

[0002]在企业的标准成本核算中,需要涉及到企业的财务结算内容,企业的财务结算通常有内部单位间的结算、与供应商的结算以及与银行间的结算等,而这些结算的过程中往往需要用到财务凭证。现有的纸质财务凭证包括的内容一般有摘要、科目、金额、制证日期、借贷方向等。但是纸质财务凭证保存较为困难,同时在进行查证、审计时较为麻烦,需要将纸质财务凭证进行电子化存储,现有的将纸质财务凭证进行电子化存储的过程只是简单的将纸质财务凭证进行图像提取记录,并不能自动获取纸质财务凭证种类信息、金额信息以及防伪信息,这些信息需要人工识别获取,效率较低且容易出错。
[0003]中国专利公开号CN112598062A,公开日2021年4月2日,名称为《一种图像识别方法和装置》的专利技术专利中公开了一种图像识别方法和装置,该方法包括:获取待识别图像;从待识别图像中随机裁剪出具有预设图像大小的图像块;将图像块输入训练好的神经网络分类模型获取图像块的分类结果;根据分类结果确定分类置信度;根据分类置信度确定是否将当前分类结果作为最终图像识别结果;当不能将当前分类结果作为最终图像识别结果时,以迭代计算的形式根据特征图和定位策略网络重新获得下一个图像块,并根据下一个图像块获取下一个分类置信度,直至根据获得的分类置信度确定出将当前分类结果作为最终图像识别结果。不足之处在于,该专利技术只是公开了对图像的一种识别方法,并不能将该识别方法运用到纸质财务凭证的图像识别中,对于纸质产物凭证的金额信息等也无法做到较好的识别。

技术实现思路

[0004]本专利技术的目的是克服现有技术中的缺点,提供一种财务凭证信息自动识别方法。
[0005]本专利技术的目的是通过下述技术方案予以实现:一种财务凭证信息自动识别方法,图像分析模块对纸质财务凭证的图像信息进行图像特征信息提取,然后图像分析模块根据图像特征信息进行分析得到数据信息,数据信息进行电子化存储;所述的图像特征信息包括:纸质财务凭证的类别信息、纸质财务凭证的金额信息和纸质财务凭证的验证信息,在纸质财务凭证的类别信息识别中,图像分析模块根据不同种类的纸质财务凭证对应的不同的类别信息确定纸质财务凭证的类别;在对于纸质财务凭证的金额信息识别中,图像分析模块通过以下步骤完成图像特征信息提取:如图1所示,图像分析模块获取纸质财务凭证的类别,根据纸质财务凭证的类别确定金额信息提取的范围及类别,金额信息提取的类别为阿拉伯数字信息;
步骤2,在金额信息提取的范围内对金额信息进行特征提取,然后将金额信息的图像信息转换成数值信息,具体方式为:确定金额信息内每一个数值的图像区域,图像区域内的数值为待识别数值,对于任意一个图像区域,通过卷积神经网络进行识别,将图像区域的待识别数值与卷积神经网络预训练的数值信息进行比对确定置信度,若待识别数值与某一个数值信息的置信度大于等于设定的阈值,且该待识别数值与其他数值信息的置信度小于设定的阈值,则该待识别数值确定为置信度大于等于设定阈值对应的数值信息,若待识别数值与所有数值信息的置信度均小于设定的阈值,则执行纠错分析步骤,使待识别数值确定具体数值信息;步骤3,所有待识别数值均识别完成,则完成金额信息图像特征信息提取;在纸质财务凭证的验证信息识别中,图像分析模块根据预设的映射规则将验证信息进行还原验证真伪。
[0006]所述的纠错分析步骤具体包括:将待识别数值的图像区域分解成若干块子图像区域,同时卷积神经网络预训练的数值信息也对应分解成若干块子数值信息,对于任意一个子图像区域,通过卷积神经网络进行识别,将该子图像区域内待识别子数值与卷积神经网络预训练的子数值信息进行比对确定子置信度,若该子图像区域内待识别子数值与某一个子数值信息的置信度大于等于设定的子置信度阈值,同时该子图像区域内待识别子数值与其他的子数值信息的置信度小于设定的子置信度设定阈值,则将子数值信息对应的数值信息确定为待识别数值的数值信息。
[0007]本方案将纸质财务凭证分为三类待识别区域,在图像特征信息提取过程中,首先提取的是纸质财务凭证的类别信息,类别信息一般为较易识别的信息,可以是二维码或条形码,更多地可以和颜色相结合,确保纸质财务凭证的类别信息识别读取准确率较高,不会出错。在确定纸质财务凭证的类别信息后,根据纸质财务凭证的类别,调取预设的每一个类别对应的金额信息提取的范围,就可以快速对金额信息进行图像特征信息提取,金额信息在本方案中提供卷积神经网络进行识别,将图像信息转换为具体的金额数据进行存储。更多地,本方案还设计了验证信息,验证信息一般用于对纸质财务凭证的防伪识别,验证信息可以是防伪码或者防伪水印,在确保纸质财务凭证真伪的同时还可以对纸质财务凭证的类别信息的识别进行验证是否识别正确。综上所述,本方案对于财务凭证存储记录不仅仅是做到了图像的存储,而且对于财务凭证的数据进行了数据化的存储,节约了人工成本,且减少了人工记录的误差,同时对于验证信息的识别进一步提高了识别的准确率。
[0008]由于纸质财务凭证的金额信息可能是人工填写或者是打印的数据,人工填写会由于每个人的字迹不一造成数值的大小形状不统一,而打印的数据则会产生打印深浅不一的问题,这些都会导致卷积神经网路对金额信息的图像特征信息提取发生错误的情况。因此,本方案中,对于金额信息的图像特征信息提取设置了纠错分析步骤,将待识别数值的图像区域分解成若干块子图像区域,对于任意一块子图像区域如果与对应的子数值信息相匹配,那么可以认为子数值信息对应的数值信息确定为待识别数值的数值信息,此设计优化了对于金额信息的图像特征信息提取的能力。
[0009]作为优选,所述的纠错分析步骤还包括:若该子图像区域内待识别子数值与其中至少两个子数值信息的置信度大于等于
设定的子置信度阈值,则将这些子数值信息对应的数值信息作为候选数值信息,且对待识别数值的其他子图像区域进行置信度分析,若其他任意一个子图像区域内待识别子数值与某一个子数值信息的置信度大于等于设定的子置信度阈值,同时该子图像区域内待识别子数值与其他的子数值信息的置信度小于设定的子置信度设定阈值,且该子数值信息对应的数值信息与候选数值信息中某一个数值信息相同,则该子数值信息对应的数值信息即为待识别数值的数值信息。
[0010]若分解成若干块子图像区域,对于某一个子图像区域,与至少两个子数值信息的置信度大于等于设定的子置信度阈值,例如阿拉伯数字6或8的下半部分作为子图像区域时,6或8作为子数值信息的置信度均大于设定的子置信度阈值,此时,分析待识别数值的其他子图像区域的置信度,此时6或8其他子图像区域的置信度会相差较大,因此,本方案的设计进一步提升了对于金额信息的图像特征信息提取的能力。
[0011]作为优选,所述的若干块子图像区域的大小均相等,若干块子图像区域将图像区域进行横向等分或纵向等分;所述的纠错分析子步骤具体为:子步骤a,对于单个子图像区域,寻找每一个数值信息中与单个子图像区域大小相等本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种财务凭证信息自动识别方法,其特征是,图像分析模块对纸质财务凭证的图像信息进行图像特征信息提取,然后图像分析模块根据图像特征信息进行分析得到数据信息,数据信息进行电子化存储;所述的图像特征信息包括:纸质财务凭证的类别信息、纸质财务凭证的金额信息和纸质财务凭证的验证信息,在纸质财务凭证的类别信息识别中,图像分析模块根据不同种类的纸质财务凭证对应的不同的类别信息确定纸质财务凭证的类别;在对于纸质财务凭证的金额信息识别中,图像分析模块通过以下步骤完成图像特征信息提取:步骤1,图像分析模块获取纸质财务凭证的类别,根据纸质财务凭证的类别确定金额信息提取的范围及类别,金额信息提取的类别为阿拉伯数字信息;步骤2,在金额信息提取的范围内对金额信息进行特征提取,然后将金额信息的图像信息转换成数值信息,具体方式为:确定金额信息内每一个数值的图像区域,图像区域内的数值为待识别数值,对于任意一个图像区域,通过卷积神经网络进行识别,将图像区域的待识别数值与卷积神经网络预训练的数值信息进行比对确定置信度,若待识别数值与某一个数值信息的置信度大于等于设定的阈值,且该待识别数值与其他数值信息的置信度小于设定的阈值,则该待识别数值确定为置信度大于等于设定阈值对应的数值信息,若待识别数值与所有数值信息的置信度均小于设定的阈值,则执行纠错分析步骤,使待识别数值确定具体数值信息;步骤3,所有待识别数值均识别完成,则完成金额信息图像特征信息提取;在纸质财务凭证的验证信息识别中,图像分析模块根据预设的映射规则将验证信息进行还原验证真伪;所述的纠错分析步骤具体包括:将待识别数值的图像区域分解成若干块子图像区域,同时卷积神经网络预训练的数值信息也对应分解成若干块子数值信息,对于任意一个子图像区域,通过卷积神经网络进行识别,将该子图像区域内待识别子数值与卷积神经网络预训练的子数值信息进行比对确定子置信度,若该子图像区域内待识别子数值与某一个子数值信息的置信度大于等于设定的子置信度阈值,同时该子图像区域内待识别子数值与其他的子数值信息的置信度小于设定的子置信度设定阈值,则将子数值信息对应的数值信息确定为待识别数值的数值信息。2.根据权利要求1所述的一种财务凭证信息自动识别方法,其特征是,所述的纠错分析步骤还包括:若该子图像区域内待识别子数值与其中至少两个子数值信息的置信度大于等于设定的子置信度阈值,则将这些子数值信息对应的数值信息作为候选数值信息,且对待识别数值的其他子图像区域进行置信度分析,若其他任意一个子图像区域内待识别子数值与某一个子数值信息的置信度大于等于设定的子置信度阈值,同时该子图像区域内待识别子数值与其他的子数值信息的置信度小于设定的子置信度设定阈值,且该子数值信息对应的数值信息与候选数值信息中某一个数值信息相同,则该子数值信息对应的数值信息即为待识别数值的数值信息。3.根...

【专利技术属性】
技术研发人员:郑瑛孙泉辉程嵩高翔郭端宏潘军
申请(专利权)人:国网浙江省电力有限公司金华供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1