一种结构文本化营业执照图片的方法技术

技术编号：31696676 阅读：19 留言：0更新日期：2022-01-01 10:56

本发明专利技术公开了一种结构文本化营业执照图片的方法，涉及结构文本化图片处理技术领域，使用了四个阶段对营业执照目标进行检测，营业执照文本进行检测，营业执照文字进行识别，文字内容进行结构化输出，该流程有效的规避了目前市场上大部分营业执照ocr识别算法对于复杂背景和一图多证的鲁棒性较差的痛点，同时弥补了主流方案对于输出文本结构化的匮乏，其可实现多场景多营业执照的自动检测以及文本内容结构化的智能提取，助力快速检索和采集入库公司营业执照信息，提升了工作效率。提升了工作效率。提升了工作效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种结构文本化营业执照图片的方法

[0001]本专利技术涉及结构文本化图片处理
，尤其涉及一种结构文本化营业执照图片的方法。

技术介绍

[0002]市场上各大厂已有成产品化的营业执照识别硬件和方法，大部分以服务端接口互联网调用方式作为产品化，在银行、税务局、警务处都有着庞大的应用市场。
[0003]现有技术大部分需要固定拍摄营业执照的姿态和营业执照在图片中的占比，严重影响用户体验，对于户外民警手持拍摄采集和用户自然场景调用及其不友好。
[0004]现有技术大部分以文本识别的方式为核心点，忽略了结构化输出字段的重要性，舍弃了营业执照业务场景的真实需求点。
[0005]目前市场存在另一种方案，即在步骤3裁剪出字段图片后进行深度分类网络进行智能分类到不同的字段类别，改方案在有效性上略逊于本专利技术，但是在时间效率上由于进行了多一次深度网络分类，耗时更长。
[0006]目前市场存在另一种方案，采用NLP算法直接对步骤5中输出的识别字符串进行分类，但是NLP中的规则制定成本较高，不适应与本专利技术方案的普适性，即只能用于“营业执照”，当迁移到其他证卡识别时，规则全部需要重新制定。

技术实现思路

[0007]本专利技术所要解决的技术问题是针对上述现有技术的不足提供一种结构文本化营业执照图片的方法，其可实现多场景多营业执照的自动检测以及文本内容结构化的智能提取，助力快速检索和采集入库公司营业执照信息，提升了工作效率。
[0008]本专利技术为解决上述技术问题采用以下技术...

【技术保护点】

【技术特征摘要】
1.一种结构文本化营业执照图片的方法，其特征在于：具体包括以下步骤：步骤1，选取N张带有标注的营业执照图片作为训练样本，通过训练得到营业执照检测模型、字段检测模型和字段识别模型；其中，N>1000；步骤2，待识别的训练样本通过营业执照检测模型输出营业执照的四点坐标和旋转角度θ
i
，其中，i∈k，k表示此样本中包含的营业执照总数；将每个营业执照分别进行后续操作，其中，四点坐标按照左下角为起点，顺时针方向排序；步骤3，通过步骤2营业执照检测模型输出营业执照的四点坐标将营业执照图像进行裁剪得到四边形矩阵，得到了k个只包含一张营业执照的前景图片；步骤4：将前景图片通过字段检测模型进行检测，若检测成功则得到n个文本四点坐标(A，B)位置和所述字段类别(δ)，其中，n代表当前前景图片的文本总数目，(A,B)＝[(a1,b1),(a2,b2),(a3,b3),(a4,b4)]字段类别δ＝{C0:F0,...C
i
:F
i
...,C
t_k
:F
t_k
}，其中，t_k为阈值top_k，表示取最近的前top_k个文本类别C
i
，F
i
代表网络输出的分数，文本四边形坐标通过步骤3中相同的透射变换操作，将前景图片裁剪成n个文本矩形图片，其中，每个文本矩形图片M
i
与字段类别δ
i
一一对应；步骤5，将步骤4获取的文本矩形图片通过OCR文本框识别模型，得到n个文本字段字符串；步骤6，结合文本字段内容S
i
和字段类别δ
i
，联合判别得到最终类别Class，具体联合判别方式如下：对于每个字段类别δ
i
，若F
i

【专利技术属性】
技术研发人员：穆宁，郭涛远，李磊，朱和军，王康，
申请(专利权)人：南京烽火天地通信科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人