System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 票据识别方法、装置、计算机设备和存储介质制造方法及图纸_技高网

票据识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:40413773 阅读:7 留言:0更新日期:2024-02-20 22:31
本申请涉及一种票据识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取多种票据类型的标准图像;针对每一票据类型的标准图像,根据光学字符识别模型确定标准图像对应的文本框;在标准图像包含的文本框中,根据关键信息抽取模型确定各文本框对应的元素属性和键与键值的对应关系;元素属性包括键和键值;基于标准图像包含的文本框的元素属性、键与键值的对应关系和票据类型,构建票据类型的票据识别模板;票据识别模板用于根据待检测图像的光学字符识别结果确定票据识别结果。采用本方法能够提高票据识别效率。

【技术实现步骤摘要】

本申请涉及自动化识别,特别是涉及一种票据识别方法、装置、计算机设备、存储介质和计算机程序产品。


技术介绍

1、随着计算机图像识别技术的发展,自动化图像识别可以代替人工识别,对大批量的图像中的内容进行自动识别,例如,保险业务中需要对大量票据、表单等进行票据和表单中的内容进行识别,用于保险理赔的自动化处理。

2、传统技术中,对于票据的自动化识别可以使用ocr(optical characterrecognition,光学字符识别)技术,分别对每一种类型的票据开发对应的票据提取程序,通过票据提取模型中具有针对性的键值对的位置信息,对包含票据的待检测图像进行文本提取,得到待检测图像中包含的票据识别结果。

3、然而,传统技术中,为每一种票据构建对应的票据提取程序,会导致票据识别的效率较低。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种票据识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种票据识别方法,包括:

3、获取多种票据类型的标准图像;

4、针对每一票据类型的所述标准图像,根据光学字符识别模型确定所述标准图像对应的文本框;

5、在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性和键与键值的对应关系;所述元素属性包括所述键和所述键值;

6、基于所述标准图像包含的文本框的元素属性、所述键与所述键值的对应关系和所述票据类型,构建所述票据类型的票据识别模板;所述票据识别模板用于根据待检测图像的光学字符识别结果确定票据识别结果。

7、在其中一个实施例中,所述在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性,包括:

8、在所述标准图像包含的所述文本框中,确定每个所述文本框的目标尺寸属性;

9、根据所述关键信息抽取模型和每个所述文本框的所述目标尺寸属性,确定每个所述文本框对应的元素属性。

10、在其中一个实施例中,所述在所述标准图像包含的所述文本框中,确定每个所述文本框的目标尺寸属性,包括:

11、在所述标准图像包含的所述文本框中,确定第一目标文本框;

12、根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性;

13、将下一所述文本框作为新的第一目标文本框,执行根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性的步骤,直至得到每个所述文本框对应的所述目标尺寸属性。

14、在其中一个实施例中,所述根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性,包括:

15、在所述第一目标文本框作为键的情况下,将所述第一目标文本框的当前尺寸属性作为所述第一目标文本框作为键的情况下的目标尺寸属性;

16、在所述第一目标文本框作为键值的情况下,对所述第一目标文本框的当前尺寸属性进行膨胀,直至所述当前尺寸属性为未覆盖其他文本框的最大尺寸属性,将所述最大尺寸属性作为所述第一目标文本框作为键值的情况下的目标尺寸属性。

17、在其中一个实施例中,所述在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性之后,所述方法还包括:

18、获取第一目标类型和第二目标类型,并根据所述第一目标类型和所述第二目标类型分别确定第一目标键和第二目标键;

19、根据所述第一目标键和所述第二目标键分别确定第一目标键值和第二目标键值;

20、根据预设数据转换规则对所述第一目标键值进行格式转换,得到目标键值格式;

21、确定与所述第二目标键值所属的第二目标文本框相邻的第三目标文本框,并基于所述第三目标文本框和预设检验模型对所述第二目标键值进行识别检验,在所述识别检验为检验不通过的情况下,输出并展示告警信息。

22、在其中一个实施例中,所述针对每一所述票据类型的所述标准图像,基于所述标准图像包含的文本框的元素属性、所述键与所述键值的对应关系和所述票据类型,构建所述票据类型的票据识别模板之后,所述方法还包括:

23、获取待检测图像的光学字符识别结果和所述待检测图像的图像特征类型;

24、根据所述图像特征类型在多种所述票据类型中确定目标票据类型;

25、在票据识别模板库包含的多种票据类型的票据识别模板中,基于所述目标票据类型确定目标票据类型对应的目标票据识别模板;

26、基于所述目标票据识别模板对所述光学字符识别结果进行票据识别,确定票据识别结果。

27、第二方面,本申请还提供了一种票据识别装置,包括:

28、第一获取模块,用于获取多种票据类型的标准图像;

29、第一确定模块,用于针对每一票据类型的所述标准图像,根据光学字符识别模型确定所述标准图像对应的文本框;

30、第二确定模块,用于在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性;所述元素属性包括键和键值;

31、构建模块,用于基于所述标准图像包含的文本框的元素属性、所述键与所述键值的对应关系和所述票据类型,构建所述票据类型的票据识别模板;所述票据识别模板用于根据待检测图像的光学字符识别结果确定票据识别结果。

32、在其中一个实施例中,所述第二确定模块具体用于在所述标准图像包含的所述文本框中,确定每个所述文本框的目标尺寸属性;

33、根据所述关键信息抽取模型和每个所述文本框的所述目标尺寸属性,确定每个所述文本框对应的元素属性。

34、在其中一个实施例中,所述第二确定模块具体用于在所述标准图像包含的所述文本框中,确定第一目标文本框;

35、根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性;

36、将下一所述文本框作为新的第一目标文本框,执行根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性的步骤,直至得到每个所述文本框对应的所述目标尺寸属性。

37、在其中一个实施例中,所述第二确定模块具体用于在所述第一目标文本框作为键的情况下,将所述第一目标文本框的当前尺寸属性作为所述第一目标文本框作为键的情况下的目标尺寸属性;

38、在所述第一目标文本框作为键值的情况下,对所述第一目标文本框的当前尺寸属性进行膨胀,直至所述当前尺寸属性为未覆盖其他文本框的最大尺寸属性,将所述最大尺寸属性作为所述第一目标文本框作为键值的情况下的目标尺寸本文档来自技高网...

【技术保护点】

1.一种票据识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性,包括:

3.根据权利要求2所述的方法,其特征在于,所述在所述标准图像包含的所述文本框中,确定每个所述文本框的目标尺寸属性,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性,包括:

5.根据权利要求1所述的方法,其特征在于,所述在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性之后,所述方法还包括:

6.根据权利要求1所述的方法,其特征在于,所述针对每一所述票据类型的所述标准图像,基于所述标准图像包含的文本框的元素属性、所述键与所述键值的对应关系和所述票据类型,构建所述票据类型的票据识别模板之后,所述方法还包括:

7.一种票据识别装置,其特征在于,所述装置包括:

<p>8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种票据识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性,包括:

3.根据权利要求2所述的方法,其特征在于,所述在所述标准图像包含的所述文本框中,确定每个所述文本框的目标尺寸属性,包括:

4.根据权利要求3所述的方法,其特征在于,所述根据所述第一目标文本框和所述文本框中的其他文本框的位置关系,确定所述第一目标文本框分别作为键和键值的不同情况下的目标尺寸属性,包括:

5.根据权利要求1所述的方法,其特征在于,所述在所述标准图像包含的所述文本框中,根据关键信息抽取模型确定各所述文本框对应的元素属性之后,所述方法还包括:

6.根据权利要...

【专利技术属性】
技术研发人员:刘毅超
申请(专利权)人:中国人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1