发票匹配方法、装置、电子设备和存储介质制造方法及图纸

技术编号:25952619 阅读:32 留言:0更新日期:2020-10-17 03:44
本发明专利技术实施例公开了一种发票匹配方法、装置、电子设备和存储介质,该方法包括:对发票图像执行光学字符识别获得发票的发票信息,该发票信息包括发票号码、发票代码、发票金额以及识别码,根据预先存储的台账计算发票号码的号码匹配度;基于号码匹配度判断待匹配发票是否与台账匹配;若是,确定发票匹配成功,将发票信息录入台账;若否,在号码匹配度大于或等于第一阈值时,依次根据发票代码、发票金额以及识别码对待匹配发票进行匹配,以识别待匹配发票。由于在发票号码匹配失败时,依次采用发票代码、发票金额以及识别码来进行匹配,避免了一项匹配失败而跳过发票匹配的问题,通过多重匹配发票,可以实现发票的准确匹配,无需人工插足处理。

【技术实现步骤摘要】
发票匹配方法、装置、电子设备和存储介质
本专利技术实施例涉及发票匹配
,尤其涉及一种发票匹配方法、装置、电子设备和存储介质。
技术介绍
发票是指一切单位和个人在购销商品、提供劳务或接受劳务、服务以及从事其他经营活动,所提供给对方的收付款的书面证明,是财务收支的法定凭证,是会计核算的原始依据,也是审计机关、税务机关执法检查的重要依据。对于税局来说,在发票对账时,税局通常有企业的开票信息(即台账),如发票代码、发票号码、发票金额等简单信息,如果需要发票更为详细的信息则需要对发票进行OCR识别。在发票图像匹配台账的过程中,发票能够匹配台账时将发票的详细信息录入,然而,在发票OCR识别时,如果无法做到100%与台账相符,仍需要人工后续对发票进行勾对处理。
技术实现思路
本专利技术实施例提供一种发票匹配方法、装置、电子设备和存储介质,以解决现有技术中发票匹配准确度不足,需要人工插足处理发票的问题。第一方面,本专利技术实施例提供了一种发票匹配方法,包括:获取待匹配发票的发票图像;对所述发票图像执行光学字符识别获得所述发票的发票信息,所述发票信息至少包括所述待匹配发票的发票号码、发票代码、发票金额以及识别码;根据预先存储的台账计算所述发票号码的号码匹配度;基于所述号码匹配度判断所述待匹配发票是否与所述台账匹配;若是,确定所述发票匹配成功,将所述发票信息录入所述台账;若否,判断所述号码匹配度是否大于或等于预设第一阈值;在所述号码匹配度大于或等于所述第一阈值时,依次根据所述发票代码、发票金额以及识别码对所述待匹配发票进行匹配。第二方面,本专利技术实施例提供了一种发票匹配装置,包括:发票图像获取模块,用于获取待匹配发票的发票图像;发票信息获取模块,用于对所述发票图像执行光学字符识别获得所述发票的发票信息,所述发票信息至少包括所述待匹配发票的发票号码、发票代码、发票金额以及识别码;发票号码匹配度计算模块,用于根据预先存储的台账计算所述发票号码的号码匹配度;号码匹配模块,用于基于所述号码匹配度判断所述待匹配发票是否与所述台账匹配;号码匹配成功确定模块,用于确定所述发票匹配成功,将所述发票信息录入所述台账;号码匹配度判断模块,用于判断所述号码匹配度是否大于或等于预设第一阈值;多重匹配模块,用于在所述号码匹配度大于或等于所述第一阈值时,依次根据所述发票代码、发票金额以及识别码对所述待匹配发票进行匹配。第三方面,本专利技术实施例提供了一种电子设备,所述电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本专利技术任一实施例所述的发票匹配方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本专利技术任一实施例所述的发票匹配方法。本专利技术实施例对待匹配发票的发票图像执行光学字符识别获得发票的发票信息,该发票信息至少包括待匹配发票的发票号码、发票代码、发票金额以及识别码,根据预先存储的台账计算发票号码的号码匹配度,基于号码匹配度判断待匹配发票是否与台账匹配;若是,确定发票匹配成功并将发票信息录入台账,若否,在号码匹配度大于或等于第一阈值时,依次根据发票代码、发票金额以及识别码对待匹配发票进行匹配。由于在采用发票号码匹配失败时,依次采用发票代码、发票金额以及识别码对待匹配发票进行匹配,避免了其中一项匹配失败而跳过该发票匹配的问题,通过多重匹配校验发票,消除了OCR识别发票信息的误差影响,提高了发票的准确匹配,无需人工插足处理发票的匹配。附图说明图1是本专利技术实施例一提供的一种发票匹配方法的步骤流程图;图2是本专利技术实施例二提供的一种发票匹配方法的步骤流程图;图3是本专利技术实施例三提供的一种发票匹配装置的结构框图;图4是本专利技术实施例四提供的一种电子设备的结构框图。具体实施方式下面结合附图和实施例对本专利技术作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本专利技术,而非对本专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本专利技术相关的部分而非全部结构。实施例一图1为本专利技术实施例一提供的一种发票匹配方法的步骤流程图,本专利技术实施例可适用于对发票匹配以录入发票信息的情况,该方法可以由发票匹配装置来执行,该装置可以通过软件和/或硬件的方式来实现,并集成在执行本方法的电子设备中,具体地,如图1所示,本专利技术实施例的发票匹配方法可以包括如下步骤:S101、获取待匹配发票的发票图像。本专利技术实施例中,待匹配发票可以是增值税发票和普通发票,具体地,对于待匹配发票可以通过拍照、扫描等方式获得待匹配发票的发票图像,该发票图像的格式可以是JPEG、TIFF等,当然,还可以将待匹配发票扫描为PDF文件,本专利技术实施例对发票的类型、获取待匹配发票的发票图像的方式不加以限制。S102、对所述发票图像执行光学字符识别获得所述发票的发票信息,所述发票信息至少包括所述待匹配发票的发票号码、发票代码、发票金额以及识别码。具体地,可以通过OCR(OpticalCharacterRecognition,光学字符识别)获得发票图像上的发票信息。OCR是指电子设备(例如扫描仪或数码相机)检查纸张上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。在本专利技术实施例中,发票信息通常可以包括发票号码、发票代码、发票金额以及识别码等,其中识别码可以包括购买方纳税人识别码和销售方纳税人识别码,当然,发票信息还可以包括开票日期、购买方名称购买方地址电话、购买方开户行账号、销售方名称销售方地址电话、销售方开户行账号、密码区信息、收款人、复核人、开票明细、税率和税额中的至少一种。本专利技术实施例可以通过OCR识别技术对发票图像进行识别,获得上述发票信息。S103、根据预先存储的台账计算所述发票号码的号码匹配度。在本专利技术的一个应用场景中,系统的台账中预先录入待匹配发票的发票号码、发票代码、发票金额以及识别码作为基本信息,需要在台账中添加开票日期、购买方名称购买方地址电话、购买方开户行账号、销售方名称销售方地址电话、销售方开户行账号、密码区信息、收款人、复核人、开票明细、税率和税额等具体发票信息,因此需要对纸质发票进行OCR识别,将识别到的发票信息增加到台账中相应的发票信息中,即需要对纸质发票和台账中的电子发票进行匹配对账。在本专利技术的一个实施例中,可以先通过发票号码来匹配发票,因此可以计算识别到的待匹配发票的发票号码与台账中多个预先存储的每个发票号码的号码匹配度,该号码匹配度可以是两个发票号码的相似度。S104、基于所述号码匹配度判断所述待匹配发票是否与所述台账匹配。具体地,可以根据号码匹配度的大小来确定待匹配发票本文档来自技高网...

【技术保护点】
1.一种发票匹配方法,其特征在于,包括:/n获取待匹配发票的发票图像;/n对所述发票图像执行光学字符识别获得所述发票的发票信息,所述发票信息至少包括所述待匹配发票的发票号码、发票代码、发票金额以及识别码;/n根据预先存储的台账计算所述发票号码的号码匹配度;/n基于所述号码匹配度判断所述待匹配发票是否与所述台账匹配;/n若是,确定所述待匹配发票匹配成功,将所述发票信息录入所述台账;/n若否,判断所述号码匹配度是否大于或等于预设第一阈值;/n在所述号码匹配度大于或等于所述第一阈值时,依次根据所述发票代码、发票金额以及识别码对所述待匹配发票进行匹配。/n

【技术特征摘要】
1.一种发票匹配方法,其特征在于,包括:
获取待匹配发票的发票图像;
对所述发票图像执行光学字符识别获得所述发票的发票信息,所述发票信息至少包括所述待匹配发票的发票号码、发票代码、发票金额以及识别码;
根据预先存储的台账计算所述发票号码的号码匹配度;
基于所述号码匹配度判断所述待匹配发票是否与所述台账匹配;
若是,确定所述待匹配发票匹配成功,将所述发票信息录入所述台账;
若否,判断所述号码匹配度是否大于或等于预设第一阈值;
在所述号码匹配度大于或等于所述第一阈值时,依次根据所述发票代码、发票金额以及识别码对所述待匹配发票进行匹配。


2.根据权利要求1所述的方法,其特征在于,还包括:
在所述号码匹配度小于所述第一阈值时,确定所述待匹配发票匹配失败。


3.根据权利要求1所述的方法,其特征在于,所述台账包括多个发票号码,所述根据预先存储的台账计算所述待匹配发票的发票号码的号码匹配度,包括:
针对所述台账的每个发票号码,统计所述台账的每个发票号码与所述待匹配发票的发票号码中字符内容和字符位置均相同的字符的字符数量;
计算所述字符数量与发票号码的总字符数量的比值,以作为所述待匹配发票的发票号码的号码匹配度。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述台账还包括多个发票代码、发票金额以及识别码,所述在所述号码匹配度大于或等于所述第一阈值时,依次根据所述发票代码、发票金额以及识别码对所述待匹配发票进行匹配,包括:
计算所述待匹配发票的发票代码的代码匹配度;
基于所述代码匹配度判断所述待匹配发票是否与所述台账匹配;
若是,确定所述待匹配发票匹配成功,将所述发票信息录入所述台账;
若否,判断所述代码匹配度是否大于或等于第二阈值;
在所述代码匹配度小于所述第二阈值时,确定所述待匹配发票匹配失败;
在所述代码匹配度大于或等于所述第二阈值时,计算所述待匹配发票的金额匹配度;
基于所述金额匹配度判断所述待匹配发票是否与所述台账匹配;
若是,确定所述待匹配发票匹配成功,将所述发票信息录入所述台账;
若否,判断所述金额匹配度是否大于或等于第三阈值;
在所述代码匹配度小于所述第三阈值时,确定所述待匹配发票匹配失败;
在所述代码匹配度大于或等于所述第三阈值时,计算所述待匹配发票的识别码匹配度;
基于所述识别码匹配度判断所述待匹配发票是否与所述台账匹配;
若是,确定所述待匹配发票匹配成功,将所述发票信息录入所述台账;
若否,确定所述待匹配发票匹配失败。

<...

【专利技术属性】
技术研发人员:黄科李志华张驰俊王杜鑫
申请(专利权)人:广东电网有限责任公司梅州供电局
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1