图像识别方法及装置、电子设备和存储介质制造方法及图纸

技术编号：39246867 阅读：19 留言：0更新日期：2023-10-30 11:59

提供一种图像识别方法及装置、电子设备和存储介质。该图像识别方法包括：获取待处理图像；对该待处理图像进行文本检测，以获得一个或多个文本框以及该一个或多个文本框的第一位置信息；对该一个或多个文本框进行文本识别，以获得该一个或多个文本框包含的一个或多个文本信息；基于该一个或多个文本信息，确定待处理图像中是否存在表格区域；以及响应于确定该待处理图像中存在表格区域：基于该一个或多个文本框中位于表格区域内的至少一个第一文本框的第一位置信息，确定该至少一个第一文本框中的每个第一文本框的表格行列信息；并且基于每个第一文本框的表格行列信息和每个第一文本框包含的文本信息，输出与待处理图像的表格区域对应的结构化数据。表格区域对应的结构化数据。表格区域对应的结构化数据。

全部详细技术资料下载

【技术实现步骤摘要】
图像识别方法及装置、电子设备和存储介质

[0001]本公开涉及图像识别领域，特别涉及一种图像识别方法及装置、电子设备、计算机机可读存储介质以及计算机程序产品。

技术介绍

[0002]在许多应用场景中，通常需要获取图像中所包含的文本信息。一种较为常见的方式是经由人工对图像中所包含的文本信息进行提取并数字化。另外，随着人工智能技术的发展，自动识别图像并提取图像中的文本信息的技术也得到了快速发展，例如通过图像识别技术对文本信息进行识别、提取并转化为数字化的数据格式。
[0003]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0004]根据本公开的一个方面，提供了一种图像识别方法。该图像识别方法包括：获取待处理图像；对该待处理图像进行文本检测，以获得一个或多个文本框以及该一个或多个文本框的第一位置信息；对该一个或多个文本框进行文本识别，以获得该一个或多个文本框包含的一个或多个文本信息；基于该一个或多个文本信息，确定待处理图像中是否存在表格区域；以及响应于确定该待处理图像中存在表格区域：基于该一个或多个文本框中位于表格区域内的至少一个第一文本框的第一位置信息，确定该至少一个第一文本框中的每个第一文本框的表格信息；以及基于每个第一文本框的表格信息和每个第一文本框包含的文本信息，输出与待处理图像的表格区域对应的结构化...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法，包括：获取待处理图像；对所述待处理图像进行文本检测，以获得一个或多个文本框以及所述一个或多个文本框的第一位置信息；对所述一个或多个文本框进行文本识别，以获得所述一个或多个文本框包含的一个或多个文本信息；基于所述一个或多个文本信息，确定所述待处理图像中是否存在表格区域；以及响应于确定所述待处理图像中存在表格区域：基于所述一个或多个文本框中位于所述表格区域内的至少一个第一文本框的所述第一位置信息，确定所述至少一个第一文本框中的每个第一文本框对应的表格行列信息；并且基于所述每个第一文本框的所述表格行列信息和所述每个第一文本框包含的文本信息，输出与所述待处理图像的所述表格区域对应的结构化数据。2.根据权利要求1所述的方法，其中，所述表格行列信息包括：分别指示所述每个第一文本框在所述表格区域中的行与列的行标识符和列标识符。3.根据权利要求2所述的方法，其中，基于所述一个或多个文本框中位于所述表格区域内的至少一个第一文本框的所述第一位置信息，确定所述至少一个文本框中的每个文本框对应的表格行列信息包括：根据所述第一位置信息指示的竖直方向坐标，对所述至少一个第一文本框进行排序，以获得经排序的第一文本框集合；针对所述每个第一文本框，确定该第一文本框与所述第一文本框集合中的前一第一文本框的竖直方向坐标之差是否超过第一预设阈值；以及响应于确定该第一文本框与所述第一文本框集合中的前一第一文本框的竖直方向坐标之差超过第一预设阈值，将与该第一文本框对应的行标识符递增1。4.根据权利要求3所述的方法，其中，基于所述一个或多个文本框中位于所述表格区域内的至少一个第一文本框的所述第一位置信息，确定所述至少一个文本框中的每个文本框对应的表格行列信息还包括：根据所述第一位置信息指示的水平方向坐标，对所述至少一个第一文本框进行排序，以获得经排序的第二文本框集合；针对所述每个第一文本框，确定该第一文本框与所述第二文本框集合中的前一第一文本框的水平方向坐标之差是否超过第二预设阈值；响应于确定该第一文本框与所述第二文本框集合中的前一第一文本框的水平方向坐标之差超过第二预设阈值，基于该第一文本框的水平方向坐标与所述前一第一文本框的水平方向坐标...

【专利技术属性】
技术研发人员：黄依国，王欢，周骥，冯歆鹏，
申请(专利权)人：上海肇观电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人