结构化信息的检测方法、装置及设备制造方法及图纸

技术编号：33875865 阅读：13 留言：0更新日期：2022-06-22 17:04

本发明专利技术实施例提供了一种结构化信息的检测方法、装置及设备。方法包括：获取待识别文件的文件图像；基于文件图像，确定待识别文件的文件类型；对文件图像进行结构化检测，获得文件图像中字段信息的字段属性；根据文件类型和字段属性，确定待识别文件中所包括的结构化信息。本实施例提供的技术方案，通过所获得的文件图像确定待识别文件的文件类型，并对文件图像进行结构化检测，获得文件图像中字段信息的字段属性，而后根据文件类型和字段属性确定待识别文件中所包括的结构化信息，有效地实现了基于图像全局语义信息进行端到端地的结构化信息检测操作，这样极大地提高了对结构化信息进行检测的质量和效率。进行检测的质量和效率。进行检测的质量和效率。

全部详细技术资料下载

【技术实现步骤摘要】
结构化信息的检测方法、装置及设备

[0001]本专利技术涉及信息检测
，尤其涉及一种结构化信息的检测方法、装置及设备。

技术介绍

[0002]随着科学技术的飞速发展，卡证票据的应用越来越广泛，为了能够提高对卡证票据进行应用的质量和效率，可以对各种卡证票据进行电子化应用，此时需要对各种卡证票据进行信息识别操作，现有技术中，信息识别操作通常会采用光学字符识别(Optical Cha0racter Recognition，简称OCR)技术来实现，具体包括如下步骤：通过文字检测模型检测出卡证票据的文字，再通过图卷积网络(Graph Convolutional Network，简称GCN)结合文字识别内容提取文字块之间的关系，从而提取卡证票据的结构化信息。
[0003]然而，上述的信息检测方法无法实现端到端的信息提取操作，并且，在对卡证票据进行识别时，往往只能针对特定种类的卡证票据训练专用的信息检测模型，难以做到通用。

技术实现思路

[0004]本专利技术实施例提供了一种结构化信息的检测方法、装置及设备，可以实现端到端的结构化信息提取操作，并且可以针对各种卡证票据的结构化信息进行识别操作，从而提高了该方法的适用范围和实用性。
[0005]第一方面，本专利技术实施例提供了一种结构化信息的检测方法，包括：
[0006]获取待识别文件的文件图像；
[0007]基于所述文件图像，确定所述待识别文件的文件类型；
[0008]对所述文件图像进行结构化检测，获得所述文件图像中字段...

【技术保护点】

【技术特征摘要】
1.一种结构化信息的检测方法，其特征在于，包括：获取待识别文件的文件图像；基于所述文件图像，确定所述待识别文件的文件类型；对所述文件图像进行结构化检测，获得所述文件图像中字段信息的字段属性；根据所述文件类型和所述字段属性，确定所述待识别文件中所包括的结构化信息。2.根据权利要求1所述的方法，其特征在于，所述待识别文件的版式固定或者相对固定。3.根据权利要求1所述的方法，其特征在于，对所述文件图像进行结构化检测，获得所述文件图像中字段信息的字段属性，包括：获取与所述文件类型相对应的类别语义特征以及与所述文件图像相对应的图像字段特征；基于所述类别语义特征和图像字段特征对所述文件图像进行字段检测，获得所述文件图像中字段信息的字段属性。4.根据权利要求3所述的方法，其特征在于，所述字段信息的数量大于或等于所述字段属性的数量。5.根据权利要求3所述的方法，其特征在于，基于所述类别语义特征和图像字段特征对所述文件图像进行字段检测，获得所述文件图像中字段信息的字段属性，包括：对所述图像字段特征和所述类别语义特征进行归一化处理，获得与所述图像字段特征相对应的第一权值矩阵和与所述类别语义特征相对应的第二权值矩阵；根据所述图像字段特征、类别语义特征、第一权值矩阵和所述第二权值矩阵，获得所述文件图像中字段信息的字段属性。6.根据权利要求5所述的方法，其特征在于，根据所述图像字段特征、类别语义特征、第一权值矩阵和所述第二权值矩阵，获得所述文件图像中字段信息的字段属性，包括：基于所述第一权值矩阵和所述类别语义特征，确定第一参考特征；基于所述第二权值矩阵和所述图像字段特征，确定第二参考特征；根据所述第一参考特征、所述第二参考特征和所述图像字段特征，获得所述文件图像中字段信息的字段属性。7.根据权利要求6所述的方法，其特征在于，基于所述第一权值矩阵和所述类别语义特征，确定第一参考特征，包括：在所述类别语义特征中，提取与所述第一权值矩阵相对应的类别参考特征；基于所述第一权值矩阵和所述类别参考特征，确定所述第一参考特征。8.根据权利要求7所述的方法，其特征在于，基于所述第一权值矩阵和所述类别参考特征，确定所述第一参考特征，包括：将所述第一权值矩阵与所述类别参考特征的乘积，确定为所述第一参考特征。9.根据权利要求6所述的方法，其特征在于，基于所述第二权值矩阵和所述图像字段特征，确定第二参考特征，包括：将所述第二权值矩阵与所述图像字段特征的乘积，确定为所述第二参考特征。10.根据权利要求6所述的方法，其特征在于，根据所述第一参考特征、所述第二参考特征和所述图像字段特征，获得所述文件图像中字段信息的字段属性，包括：
对所述第一参考特征、第二参考特征和所述图像字段特征进行加权求和，获得所述文件图像中字段信息的字段属性。11.根据权利要求4
‑
10中任意一项所述的方法，其特征在于，根据所述文件类型和所述字段属性，确定所述待识别文件中所包括的结构化信息，包括：利用深度学习模型对所述文件类型和所述字段属性进行分析处理，获得所述待识别文件中所包括的结构化信息，其中，所述深度学习模型被训练为根据文件类型和字段属性确定文件中所包括的结构化信息。12.根据权利要求11所述的方法，其特征在于，所述方法还包括：获取用于对所述深度学习模型中最后一层特征图的通道数量进行配置的预设卡证图像；根据所述预设卡证图像对所述最后一层特征图的通道数量进行配置。13.根据权利要求12所述的方法，其特征在于，根据所述预设卡证图像对所述最后一层特征图的通道数量进行配置，包括：获取所述预设卡证图像中预设字段信息的预设字段属性；统计所述预设字段属性的数量；基于所述预设字段属性的数量对所述最后一层特征图的通道数量进行配置，其中，所述最后一层特征图的通道数量大于所述预设字段属性的数量。14.根据权利要求12所述的方法，其特征在于，所述最后一层特征图包括多个通道，每个通道对应...

【专利技术属性】
技术研发人员：龙如蛟，杨志博，王永攀，
申请(专利权)人：阿里巴巴集团控股有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人