结构化信息的检测方法、装置及设备制造方法及图纸

技术编号:33875865 阅读:13 留言:0更新日期:2022-06-22 17:04
本发明专利技术实施例提供了一种结构化信息的检测方法、装置及设备。方法包括:获取待识别文件的文件图像;基于文件图像,确定待识别文件的文件类型;对文件图像进行结构化检测,获得文件图像中字段信息的字段属性;根据文件类型和字段属性,确定待识别文件中所包括的结构化信息。本实施例提供的技术方案,通过所获得的文件图像确定待识别文件的文件类型,并对文件图像进行结构化检测,获得文件图像中字段信息的字段属性,而后根据文件类型和字段属性确定待识别文件中所包括的结构化信息,有效地实现了基于图像全局语义信息进行端到端地的结构化信息检测操作,这样极大地提高了对结构化信息进行检测的质量和效率。进行检测的质量和效率。进行检测的质量和效率。

【技术实现步骤摘要】
结构化信息的检测方法、装置及设备


[0001]本专利技术涉及信息检测
,尤其涉及一种结构化信息的检测方法、装置及设备。

技术介绍

[0002]随着科学技术的飞速发展,卡证票据的应用越来越广泛,为了能够提高对卡证票据进行应用的质量和效率,可以对各种卡证票据进行电子化应用,此时需要对各种卡证票据进行信息识别操作,现有技术中,信息识别操作通常会采用光学字符识别(Optical Cha0racter Recognition,简称OCR)技术来实现,具体包括如下步骤:通过文字检测模型检测出卡证票据的文字,再通过图卷积网络(Graph Convolutional Network,简称GCN)结合文字识别内容提取文字块之间的关系,从而提取卡证票据的结构化信息。
[0003]然而,上述的信息检测方法无法实现端到端的信息提取操作,并且,在对卡证票据进行识别时,往往只能针对特定种类的卡证票据训练专用的信息检测模型,难以做到通用。

技术实现思路

[0004]本专利技术实施例提供了一种结构化信息的检测方法、装置及设备,可以实现端到端的结构化信息提取操作,并且可以针对各种卡证票据的结构化信息进行识别操作,从而提高了该方法的适用范围和实用性。
[0005]第一方面,本专利技术实施例提供了一种结构化信息的检测方法,包括:
[0006]获取待识别文件的文件图像;
[0007]基于所述文件图像,确定所述待识别文件的文件类型;
[0008]对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段属性;
[0009]根据所述文件类型和所述字段属性,确定所述待识别文件中所包括的结构化信息。
[0010]第二方面,本专利技术实施例提供了一种结构化信息的检测装置,包括:
[0011]第一获取模块,用于获取待识别文件的文件图像;
[0012]第一确定模块,用于基于所述文件图像,确定所述待识别文件的文件类型;
[0013]第一检测模块,用于对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段属性;
[0014]第一处理模块,用于根据所述文件类型和所述字段属性,确定所述待识别文件中所包括的结构化信息。
[0015]第三方面,本专利技术实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第一方面中的结构化信息的检测方法。
[0016]第四方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第一方面中的结构化信息的检测方法。
[0017]第五方面,本专利技术实施例提供了一种结构化信息的检测方法,包括:
[0018]响应于调用信息识别服务的请求,确定所述信息识别服务对应的处理资源;
[0019]利用所述处理资源执行如下步骤:获取待识别文件的文件图像;基于所述文件图像,确定所述待识别文件的文件类型;对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段属性;根据所述文件类型和所述字段属性,确定所述待识别文件中所包括的结构化信息。
[0020]第六方面,本专利技术实施例提供了一种结构化信息的检测装置,包括:
[0021]第二确定模块,用于响应于调用信息识别服务的请求,确定所述信息识别服务对应的处理资源;
[0022]第二处理模块,用于利用所述处理资源执行如下步骤:获取待识别文件的文件图像;基于所述文件图像,确定所述待识别文件的文件类型;对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段属性;根据所述文件类型和所述字段属性,确定所述待识别文件中所包括的结构化信息。
[0023]第七方面,本专利技术实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第五方面中的结构化信息的检测方法。
[0024]第八方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第五方面中的结构化信息的检测方法。
[0025]第九方面,本专利技术实施例提供了一种结构化信息的检测方法,包括:
[0026]获取针对待识别图像的信息识别请求;
[0027]基于所述信息识别请求,确定所述待识别图像中所包括的结构化信息,所述结构化信息是基于所述待识别图像的文件类型和所述待识别图像中字段信息的字段属性所确定的,所述待识别图像中字段信息的字段属性是通过对所述待识别图像进行结构化检测获得的;
[0028]显示所述待识别图像中所包括的结构化信息。
[0029]第十方面,本专利技术实施例提供了一种结构化信息的检测装置,包括:
[0030]第三获取模块,用于获取针对待识别图像的信息识别请求;
[0031]第三确定模块,用于基于所述信息识别请求,确定所述待识别图像中所包括的结构化信息,所述结构化信息是基于所述待识别图像的文件类型和所述待识别图像中字段信息的字段属性所确定的,所述待识别图像中字段信息的字段属性是通过对所述待识别图像进行结构化检测获得的;
[0032]第三显示模块,用于显示所述待识别图像中所包括的结构化信息。
[0033]第十一方面,本专利技术实施例提供了一种电子设备,包括:存储器、处理器;其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行时实现上述第九方面中的结构化信息的检测方法。
[0034]第十二方面,本专利技术实施例提供了一种计算机存储介质,用于储存计算机程序,所述计算机程序使计算机执行时实现上述第九方面中的结构化信息的检测方法。
[0035]本实施例提供的结构化信息的检测方法、装置及设备,通过获取待识别文件的文件图像,基于文件图像确定待识别文件的文件类型,并对文件图像进行结构化检测,获得文
件图像中字段信息的字段属性,而后根据文件类型和字段属性确定待识别文件中所包括的结构化信息,从而有效地实现了运用图像的全局语义信息对待识别文件进行端到端地结构化信息检测操作,上述信息检测方法不仅简洁,并且可以极大地提高对结构化信息进行检测的质量和效率,进一步提高了该方法的实用性,有利于市场的推广与应用。
附图说明
[0036]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]图1为本专利技术实施例提供的一种结构化信息的检测方法的流程示意图;
[0038]图2为本专利技术实施例提供的一种结构化信息的检测方法的原理框图;
[0039]图3为本专利技术实施例提供的对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结构化信息的检测方法,其特征在于,包括:获取待识别文件的文件图像;基于所述文件图像,确定所述待识别文件的文件类型;对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段属性;根据所述文件类型和所述字段属性,确定所述待识别文件中所包括的结构化信息。2.根据权利要求1所述的方法,其特征在于,所述待识别文件的版式固定或者相对固定。3.根据权利要求1所述的方法,其特征在于,对所述文件图像进行结构化检测,获得所述文件图像中字段信息的字段属性,包括:获取与所述文件类型相对应的类别语义特征以及与所述文件图像相对应的图像字段特征;基于所述类别语义特征和图像字段特征对所述文件图像进行字段检测,获得所述文件图像中字段信息的字段属性。4.根据权利要求3所述的方法,其特征在于,所述字段信息的数量大于或等于所述字段属性的数量。5.根据权利要求3所述的方法,其特征在于,基于所述类别语义特征和图像字段特征对所述文件图像进行字段检测,获得所述文件图像中字段信息的字段属性,包括:对所述图像字段特征和所述类别语义特征进行归一化处理,获得与所述图像字段特征相对应的第一权值矩阵和与所述类别语义特征相对应的第二权值矩阵;根据所述图像字段特征、类别语义特征、第一权值矩阵和所述第二权值矩阵,获得所述文件图像中字段信息的字段属性。6.根据权利要求5所述的方法,其特征在于,根据所述图像字段特征、类别语义特征、第一权值矩阵和所述第二权值矩阵,获得所述文件图像中字段信息的字段属性,包括:基于所述第一权值矩阵和所述类别语义特征,确定第一参考特征;基于所述第二权值矩阵和所述图像字段特征,确定第二参考特征;根据所述第一参考特征、所述第二参考特征和所述图像字段特征,获得所述文件图像中字段信息的字段属性。7.根据权利要求6所述的方法,其特征在于,基于所述第一权值矩阵和所述类别语义特征,确定第一参考特征,包括:在所述类别语义特征中,提取与所述第一权值矩阵相对应的类别参考特征;基于所述第一权值矩阵和所述类别参考特征,确定所述第一参考特征。8.根据权利要求7所述的方法,其特征在于,基于所述第一权值矩阵和所述类别参考特征,确定所述第一参考特征,包括:将所述第一权值矩阵与所述类别参考特征的乘积,确定为所述第一参考特征。9.根据权利要求6所述的方法,其特征在于,基于所述第二权值矩阵和所述图像字段特征,确定第二参考特征,包括:将所述第二权值矩阵与所述图像字段特征的乘积,确定为所述第二参考特征。10.根据权利要求6所述的方法,其特征在于,根据所述第一参考特征、所述第二参考特征和所述图像字段特征,获得所述文件图像中字段信息的字段属性,包括:
对所述第一参考特征、第二参考特征和所述图像字段特征进行加权求和,获得所述文件图像中字段信息的字段属性。11.根据权利要求4

10中任意一项所述的方法,其特征在于,根据所述文件类型和所述字段属性,确定所述待识别文件中所包括的结构化信息,包括:利用深度学习模型对所述文件类型和所述字段属性进行分析处理,获得所述待识别文件中所包括的结构化信息,其中,所述深度学习模型被训练为根据文件类型和字段属性确定文件中所包括的结构化信息。12.根据权利要求11所述的方法,其特征在于,所述方法还包括:获取用于对所述深度学习模型中最后一层特征图的通道数量进行配置的预设卡证图像;根据所述预设卡证图像对所述最后一层特征图的通道数量进行配置。13.根据权利要求12所述的方法,其特征在于,根据所述预设卡证图像对所述最后一层特征图的通道数量进行配置,包括:获取所述预设卡证图像中预设字段信息的预设字段属性;统计所述预设字段属性的数量;基于所述预设字段属性的数量对所述最后一层特征图的通道数量进行配置,其中,所述最后一层特征图的通道数量大于所述预设字段属性的数量。14.根据权利要求12所述的方法,其特征在于,所述最后一层特征图包括多个通道,每个通道对应...

【专利技术属性】
技术研发人员:龙如蛟杨志博王永攀
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1