本发明专利技术涉及发票关键信息定位方法、装置、计算机设备及存储介质,该方法包括获取待定位发票图像;将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息;其中,卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U‑Net卷积神经网络所得的。本发明专利技术通过获取待定位发票图像,将待定位发票图像输入至以U‑Net卷积神经网络为基础网络的卷积神经网络模型,利用卷积神经网络模型先对待定位发票图像进行分类别后,再定位至待定位发票图像的关键信息部分,并输出发票关键信息,实现快速地定位出发票关键信息,且定位准确率高。
Invoice Key Information Location Method, Device, Computer Equipment and Storage Media
【技术实现步骤摘要】
发票关键信息定位方法、装置、计算机设备及存储介质
本专利技术涉及文本检测方法,更具体地说是指发票关键信息定位方法、装置、计算机设备及存储介质。
技术介绍
增值税普通发票是将除商业零售以外的增值税一般纳税人纳入增值税防伪税控系统开具和管理,也就是说一般纳税人可以使用同一套增值税防伪税控系统开具增值税专用发票、增值税普通发票等。企业和社会,个人,政府等有越来越多的发票需要整理,越来越多的时间耗费在发票上,手动录入和人工检索,不仅浪费时间,而且容易出错。急需自动化的设备进行识别。现有文字识别系统多采用传统计算机视觉算法,未采用神经网络,准确率较低,大多需要配合扫描仪等设备进行扫描,在票据干净,整洁,而且很清晰时才能起到一定的识别效果,对自然场景下各种模糊的票据却大都无能为力。现有的大多数算法在现实中手机较为随意拍摄的任意角度真实数据上的效果不佳。尤其是当考虑到发票及其容易褶皱,褪色,且手机拍摄时面临多种光线和天气条件,多角度,多设备,透视等困难。现有两种关于文本信息定位的方法,一是借助扫描仪定位关键信息的位置,并经过传统的计算机视觉手段对位置进行微调,但是这种方法要依赖于专门的扫描仪,非常不方便。而且要求票据褶皱较少,没法应对实际中褶皱发票;二是要求用户根据指令将票据在画面预对齐、摆正,检测所有的文字行,对检测的所有文字送入识别系统进行识别,并用非常复杂的后处理手段去进行版面分析,分析识别到的信息到底是什么信息。通常,采用此种方式很难将票据上大量的信息点进行结构对齐,并且由于多检测了很多多余的信息,这些多余信息中的错误将意外的影响本身关注信息的提取和定位,且后续的识别以及处理、分析中,将需要很多的计算资源。因此,有必要设计一种新的方法,实现快速地定位出发票关键信息,且定位准确率高。
技术实现思路
本专利技术的目的在于克服现有技术的缺陷,提供发票关键信息定位方法、装置、计算机设备及存储介质。为实现上述目的,本专利技术采用以下技术方案:发票关键信息定位方法,包括:获取待定位发票图像;将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息;其中,所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的。其进一步技术方案为:所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的,包括:获取带有特征标签的发票图像,以得到训练数据;构建U-Net卷积神经网络;利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。其进一步技术方案为:所述利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型,包括:将训练数据输入U-Net卷积神经网络内,以得到样本关键信息;根据样本关键信息计算损失值;根据损失值基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。其进一步技术方案为:所述U-Net卷积神经网络是产生多层的发票图像四分之一分辨率的特征图的网络。其进一步技术方案为:所述将训练数据输入U-Net卷积神经网络内,以得到样本关键信息,包括:将训练数据输入U-Net卷积神经网络内进行卷积处理,以得到文本框;合并所述文本框,以形成样本关键信息。本专利技术还提供了发票关键信息定位装置,包括:数据获取单元,用于获取待定位发票图像;提取单元,用于将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息。其进一步技术方案为:所述装置还包括:模型训练单元,用于通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络,以得到卷积神经网络模型。其进一步技术方案为:所述模型训练单元包括:训练数据获取子单元,用于获取带有特征标签的发票图像,以得到训练数据;网络构建子单元,用于构建U-Net卷积神经网络;学习子单元,用于利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。本专利技术还提供了一种计算机设备,所述计算机设备包括存储器及处理器,所述存储器上存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法。本专利技术还提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述的方法。本专利技术与现有技术相比的有益效果是:本专利技术通过获取待定位发票图像,将待定位发票图像输入至以U-Net卷积神经网络为基础网络的卷积神经网络模型,利用卷积神经网络模型先对待定位发票图像进行分类别后,再定位至待定位发票图像的关键信息部分,并输出发票关键信息,实现快速地定位出发票关键信息,且定位准确率高。下面结合附图和具体实施例对本专利技术作进一步描述。附图说明为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的发票关键信息定位方法的应用场景示意图;图2为本专利技术实施例提供的发票关键信息定位方法的流程示意图;图3为本专利技术实施例提供的发票关键信息定位方法的子流程示意图;图4为本专利技术实施例提供的发票关键信息定位方法的子流程示意图;图5为本专利技术实施例提供的发票关键信息定位方法的子流程示意图;图6为本专利技术实施例提供的使用U-Ne卷积神经网络处理典型的道路分割像素级结果的示意图;图7为本专利技术实施例提供的可视化的特征图的示意图;图8为本专利技术实施例提供的样本关键信息的示意图;图9为本专利技术实施例提供的发票关键信息定位装置的示意性框图;图10为本专利技术实施例提供的计算机设备的示意性框图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。还应当理解,在此本专利技术说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本专利技术。如在本专利技术说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解,在本专利技术说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。请参阅图1和图2,图1为本专利技术实施例提供的发票关键信息定位方法的应用场景示意图。图2为本专利技术实施例提供的发票关键信息定位方法的示意性流程图。该发票关键信息定位方法应用于服务器中。服务器与终端之间进行数据交互,从终端获取待定位发票图像后,再由卷积神经网络模型进行分类和定位,以输出发票关键信息至终端进行显示。图2是本专利技术实施例提供的发票关键信息定位方法的流程示意图。如图2所示,该方法包括以下步骤S110至S120。S110、获取待定位发票图像。在本实施例本文档来自技高网...
【技术保护点】
1.发票关键信息定位方法,其特征在于,包括:获取待定位发票图像;将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息;其中,所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U‑Net卷积神经网络所得的。
【技术特征摘要】
1.发票关键信息定位方法,其特征在于,包括:获取待定位发票图像;将待定位发票图像输入卷积神经网络模型中进行信息提取,以得到发票关键信息;其中,所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的。2.根据权利要求1所述的发票关键信息定位方法,其特征在于,所述卷积神经网络模型是通过带有特征标签的发票图像作为训练数据训练U-Net卷积神经网络所得的,包括:获取带有特征标签的发票图像,以得到训练数据;构建U-Net卷积神经网络;利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。3.根据权利要求2所述的发票关键信息定位方法,其特征在于,所述利用训练数据基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型,包括:将训练数据输入U-Net卷积神经网络内,以得到样本关键信息;根据样本关键信息计算损失值;根据损失值基于深度学习框架对U-Net卷积神经网络进行学习,以得到卷积神经网络模型。4.根据权利要求2所述的发票关键信息定位方法,其特征在于,所述U-Net卷积神经网络是产生多层的发票图像四分之一分辨率的特征图的网络。5.根据权利要求3所述的发票关键信息定位方法,其特征在于,所述将训练数据输入U-N...
【专利技术属性】
技术研发人员:张欢,李爱林,张仕洋,
申请(专利权)人:深圳市华付信息技术有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。