【技术实现步骤摘要】
快递面单识别和自矫正方法、识别系统
[0001]本专利技术涉及OCR识别(Optical Character Recognition,光学字符识别)的
,尤其涉及一种快递面单识别和自矫正方法。
技术介绍
[0002]由于当前不同快递公司的包裹,收件人、发件人的信息很难获取和共享,导致乡镇级快递转发站无法直接对接收快递进行分选,为了减轻人工分选的工作量,需要通过OCR技术对快递面单进行识别。但是不同公司快递面单的版面结构差异很大,单纯基于视觉进行版面分析难度较大,并且很多快递面单都存在随意涂抹和面单缺失等问题,导致常规OCR算法准确率较低。
[0003]当前,快递面单信息的识别通常是将快递面单当成一种特殊的复杂表格,通过表格版面分析和字符OCR算法进行解析识别,主要有三种方法:
[0004]1.直接检测文本框位置。通过目标检测或语义分割等视觉算法,检测出文本框的具体位置,同时对文本框进行OCR识别,然后从文本框的空间排布信息推导出行、列、单元格信息,结合各文本框的文本内容生成电子表格。但是这种方法极度依赖OCR检测结果和人工设计的规则,对于不同样式的快递面单,需分别做针对性开发,对于新的快递面单格式适配性和拓展性非常差。
[0005]2.检测表格线进行版面分析。通过目标检测算法检测角点,或者运用图像形态学变换、纹理提取、边缘检测等手段提取表格线,再由角点和表格线推导行、列、合并单元格的信息,然后对单元格内文本框进行OCR识别,最后结合版面分析结果生成电子表格。但是这种方法需要有比较清晰完整 ...
【技术保护点】
【技术特征摘要】
1.一种快递面单识别和自矫正方法,其特征在于,包括:步骤1,获取快递面单的图像进行文本块检测,并对文本块的字符内容进行预识别;步骤2,根据预识别的文本块的字符内容以及文本块的位置进行关系匹配分析,从而得到文本块之间的相互关系以及各文本块的类别;步骤3,根据文本块之间的相互关系以及预识别的文本块的字符内容,进行语义分析,对文本块的字符内容分别进行推理实现自矫正;步骤4,将自矫正得到的字符信息以及文本块类别作为快递面单的识别结果。2.如权利要求1所述的快递面单识别和自矫正方法,其特征在于,从视频流中截取数据帧,并将数据帧输入到预置的快递面单检测模型中获取所述快递面单的图像。3.如权利要求1所述的快递面单识别和自矫正方法,其特征在于,所述步骤2包括:步骤2.1,以文本块为单位,对各文本块进行嵌入编码,每一个文本块编码为一个嵌入向量,将所有文本块的嵌入向量进行拼接、变换得到以快递面单为单位的所有文本块的编码矩阵;步骤2.2,分析各文本块之间的相对位置关系,得到一个快递面单的所有文本块的位置编码矩阵;步骤2.3,将一个快递面单的所有文本块的编码矩阵和位置编码矩阵进行多头自注意力推理,提取每一个文本块与其他文本块之间的语义关系,并形成关系匹配矩阵;步骤2.4,基于所述关系匹配矩阵得到所述文本块的类别。4.如权利要求3所述的快递面单识别和自矫正方法,其特征在于,所述步骤2.1包括:采用分词算法将每一个文本块的文本内容进行分词处理,得到S([c1,c2,ci,
……
,cn]),其中ci为文本的最小语义单元,通过词表查询,将文本映射为一维的文本词向量S0,向量长度为L0;根据文本块编号顺序,将各文本词向量拼接为文本映射矩阵其中M0为文本块最大数量;设置2个可训练的矩阵变量和N0为模型隐变量的长度,通过E
t
=Z
t
×
K
t
+b
t
计算出该快递面单的文本块的编码矩阵5.如权利要求4所述的快递面单识别和自矫正方法,其特征在于,所述步骤2.2包括:将各文本块的中心点坐标按照一定顺序进行排序编号,得到的文本块编号记为d,对应的位置编码向量长度为N0,数值均为P
d
,其中P
d
的计算公式为将文本块编码向...
【专利技术属性】
技术研发人员:窦毅,王晓浩,温燕香,唐经航,田昊洋,
申请(专利权)人:广西桂华智能制造有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。