表格类文本语义识别方法及装置制造方法及图纸

技术编号：35430067 阅读：28 留言：0更新日期：2022-11-03 11:34

本公开提供一种表格类文本语义识别方法及装置。所述方法包括：检测待处理图像中的表格中的文本框位置；根据文本框位置，对待处理图像进行角度校正，获得第一图像；对第一图像中的文本内容进行识别，获得文本内容的语义信息。根据本公开，能够确定文本内容的文本框，并根据文本框的角度对待处理图像进行角度校正，从而减少字迹等原因对于识别的文本的干扰，提升对于手写文本的识别准确性。升对于手写文本的识别准确性。升对于手写文本的识别准确性。

全部详细技术资料下载

【技术实现步骤摘要】
表格类文本语义识别方法及装置

[0001]本公开涉及计算机
，具体涉及一种表格类文本语义识别方法及装置。

技术介绍

[0002]光学字符识别（Optical Character Recognition，OCR）技术已广泛应用于将图像中代表文字的像素点转换为可编辑的文字，更进一步，在特定的场景中，通过对文字在图片上位置关系的解析，还可将图片中的文字以特殊的形式组合起来，比如办公场景（印刷体识别、手写文字识别、表格识别），交通场景（驾驶证识别、车牌识别、车辆合格证识别），卡证场景（身份证识别、银行卡识别、户口本识别、营业执照识别）等等。
[0003]在销售场景中，供货方会提供关于商品详细信息的供货单，如商品名称、数量、单价等等，这样的货物单据往往以手写表格的形式呈现，经过实践发现目前手写表格的识别技术存在一些弊端：对于表格单元格的识别不够准确，如多单元格被识别为单元格，且单元格的识别易受到图片阴影、折痕的影响；对表格中文字的识别不够准确，目前大部分表格识别的功能是基于印刷体表格图片进行训练的，故而对表格中的手写字体的识别准确率不能达到生产要求。
[0004]公开于本申请
技术介绍
部分的信息仅仅旨在加深对本申请的一般
技术介绍
的理解，而不应当被视为承认或以任何形式暗示该信息构成已为本领域技术人员所公知的现有技术。

技术实现思路

[0005]本公开实施例提供一种表格类文本语义识别方法及装置，能够确定文本内容的文本框，并根据文本框的角度对待处理图像进行角度校正，从而减少字迹等原因对于识别的文本

【技术保护点】

【技术特征摘要】
1.一种表格类文本语义识别方法，其特征在于，包括：检测待处理图像中的表格中的文本框位置，其中，所述待处理图像为包括表格的图像，所述表格中包括文本内容，所述文本框为包围所述表格的单元格中的文本内容的矩形框；根据所述文本框位置，对所述待处理图像进行角度校正，获得第一图像；对所述第一图像中的文本内容进行识别，获得所述表格中各文本内容的语义信息。2.根据权利要求1所述的方法，其特征在于，检测待处理图像中的表格中的文本框位置，包括：获取单元格的角点坐标；根据所述角点坐标，获取单元格的二值化图像；根据所述二值化图像的各像素点的像素值，确定所述文本内容在二值化图像中的第一位置信息；根据所述第一位置信息，确定所述文本框位置。3.根据权利要求2所述的方法，其特征在于，根据所述角点坐标，获取单元格的二值化图像，包括：通过numpy工具，对各单元格进行截图，获取各单元格的第二图像；通过cv2.cvtColor工具，将所述第二图像转换为单通道灰度图；通过cv2.bitwise_not工具，将所述单通道灰度图转换为所述二值化图像。4.根据权利要求2所述的方法，其特征在于，根据所述二值化图像的各像素点的像素值，确定所述文本内容在二值化图像中的第一位置信息，包括：通过np.where工具，获取所述二值化图像中像素值不等于0的像素点的坐标信息；根据所述二值化图像中像素值不等于0的像素点的坐标信息，确定所述第一位置信息。5.根据权利要求2所述的方法，其特征在于，根据所述第一位置信息，确定所述文本框位置，包括：通过cv2.minAreaRect工具，以及所述第一位置信息，获取文本内容的最小外接矩形；将所述最...

【专利技术属性】
技术研发人员：闫恺，杜向阳，
申请(专利权)人：深圳擎盾信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人