System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 油气站数据自动录入方法、装置、电子设备及存储介质制造方法及图纸_技高网

油气站数据自动录入方法、装置、电子设备及存储介质制造方法及图纸

技术编号:40260478 阅读:17 留言:0更新日期:2024-02-02 22:51
本发明专利技术提供一种油气站数据自动录入方法、装置、电子设备及存储介质,涉及数据自动录入技术领域,获取表格图像并进行直线检测,得到表格图像的轮廓数据和第一单元格图像;对第一单元格图像中所有单元格图像进行拆分,得到多个第二单元格图像;对多个第二单元格图像中的文本数据进行识别,得到多个文本信息;计算第一单元格图像与多个样本图像之间的单元格相似度,确定目标样本图像和目标参数信息;基于目标样本图像中多个样本单元格的位置信息,将文本信息填写至对应样本单元格处,作为数据录入结果。本发明专利技术通过获取表格图像的表格和文本信息,并与样本图像数据相匹配,快速完成表格和文本信息的入库,极大提高了录入表格图像的效率和准确度。

【技术实现步骤摘要】

本专利技术涉及数据自动录入,特别是涉及一种油气站数据自动录入方法、装置、电子设备及存储介质


技术介绍

1、在危化品存储或特定场景下,需要对入库存储物品表单进行信息录入,针对现有表单信息的录入工作,通常采用工作人员手动打字输入的方式,将表单信息中的文本内容输入至应用软件中,再通过应用软件传输至数据库中,实现表单信息的录入工作。但该方法不仅录入效率低下,而且由于人工输入的问题,可能导致录入信息错误的问题。

2、基于此,本专利技术提出一种油气站数据自动录入方法,以解决人工录入表单信息带来的问题。


技术实现思路

1、本专利技术提供一种油气站数据自动录入方法、装置、电子设备及存储介质,以解决或至少部分解决上述现有技术中的问题。

2、第一方面,本专利技术实施例提供一种油气站数据自动录入方法,包括:

3、获取表格图像,所述表格图像为油气站数据表格的图像,所述表格图像至少包括一个单元格;

4、对所述表格图像进行直线检测,得到所述表格图像的轮廓数据和第一单元格图像;

5、将所述第一单元格图像中所有单元格对应的图像进行拆分,得到多个第二单元格图像;

6、对多个所述第二单元格图像中包含的文本数据进行识别,得到多个所述第二单元格图像对应的文本信息;

7、计算所述第一单元格图像与多个样本图像之间的单元格相似度,确定目标样本图像,将所述目标样本图像的参数信息作为目标参数信息,所述参数信息为所述样本图像中每个样本单元格的属性信息,所述目标样本图像为最大单元格相似度对应的样本图像;

8、基于所述目标样本图像中多个所述样本单元格的位置信息,将所述文本信息填写至所述目标样本图像中每个所述样本单元格处,作为数据录入结果,所述目标样本图像中的每个所述样本单元格的所述文本信息和所述目标参数信息一一对应。

9、在本专利技术可选地一实施例中,所述获取表格图像,包括:

10、获取待识别图像,所述待识别图像包含表格目标;

11、对所述待识别图像中包含的表格目标进行多个顶点检测,得到所述表格目标的第一位置信息,所述第一位置信息至少包括多个顶点和每个所述顶点的坐标;

12、获取所述样本图像的位置信息,所述样本图像的位置信息为第一视角下的所述样本图像的多个顶点坐标;

13、基于所述样本图像的位置信息,对所述表格目标的第一位置信息进行调整处理,得到所述表格图像,所述表格图像与所述样本图像的尺寸相同。

14、在本专利技术可选地一实施例中,所述表格图像为第一颜色空间的图像,所述对所述表格图像进行直线检测,得到所述表格图像的轮廓数据和第一单元格图像,包括:

15、将所述表格图像从所述第一颜色空间转换为第二颜色空间;

16、将所述表格图像转换为二值图,并对所述二值图进行至少一次形态处理以消除所述二值图中的噪声,得到形态图像,所述形态图像至少包括第一类像素点;

17、将所述形态图像中的所有第一类像素点进行连接,得到所述表格图像的轮廓数据,所述轮廓数据为构成所述表格图像的直线方向和直线长度;

18、对所述形态图像中的多个所述直线进行检测,得到多个所述直线的位置信息;

19、基于所述轮廓数据和多个所述直线的位置信息,将多个所述直线组成多个所述单元格;

20、将多个所述单元格,以及多个所述单元格对应的所述表格图像内的区域进行组合,得到所述第一单元格图像。

21、在本专利技术可选地一实施例中,所述将所述第一单元格图像中所有单元格对应的图像进行拆分,得到多个第二单元格图像,包括:

22、以所述第一单元格图像的任一顶点作为坐标原点,建立直角坐标系;

23、基于所述直角坐标系,获取所述第一单元格图像中每个所述单元格对应的多个顶点坐标,作为每个所述单元格的第二位置信息;

24、基于每个所述单元格对应的所述第二位置信息,获取每个所述单元格在所述第一单元格图像中的图像区域,作为所述第二单元格图像。

25、在本专利技术可选地一实施例中,所述计算所述第一单元格图像与多个样本图像之间的单元格相似度,确定目标样本图像,将所述目标样本图像的参数信息作为目标参数信息,包括:

26、基于所述轮廓数据,计算所述第一单元格图像与每个所述样本图像之间的轮廓相似度,得到多个轮廓相似度值;

27、将大于预设轮廓阈值的多个所述轮廓相似度值对应的所述样本图像,作为第一样本图像;

28、获取每个所述第二单元格图像的第二位置信息,并计算每个所述第二位置信息对应的所述第二单元格图像与每个样本单元格图像之间的位置相似度,得到多个位置相似度值,所述样本单元格图像为所述样本图像中每个单元格对应的图像;

29、对每个所述第一样本图像中的所有所述样本单元格图像的位置相似度值求和,得到多个总相似度值;

30、将最大所述总相似度值对应的所述第一样本图像作为所述目标样本图像,并获取所述目标样本图像中的参数信息作为所述目标参数信息。

31、在本专利技术可选地一实施例中,所述基于所述目标样本图像中多个所述样本单元格的位置信息,将所述文本信息填写至所述目标样本图像中每个所述样本单元格处,作为数据录入结果,包括:

32、基于所述目标样本图像中的多个样本单元格图像的位置信息,将所述第二单元格图像与在所述目标样本图像中位置相同的所述样本单元格图像一一对应;

33、将每个所述第二单元格图像内的文本信息填写至与每个所述第二单元格图像对应的所述样本单元格内;

34、基于所述第二单元格图像与所述样本单元格图像之间的对应关系,将所述目标参数信息依次与多个所述文本信息进行组合,得到多个信息对;

35、将包含多个所述信息对的所述目标样本图像作为所述数据录入结果。

36、在本专利技术可选地一实施例中,所述样本图像是从包含多种不同类型表格图像的模板数据库中获取的,所述模板数据库是通过以下方法建立的:

37、获取待录入图像,所述待录入图像包含多个不同类型的表格图像;

38、依次对所述待录入图像进行灰度化处理和二值化处理,得到待录入形态图像及所述待录入图像的轮廓数据;

39、对所述待录入形态图像中的所有直线进行检测,得到所有所述直线和由所述直线组成的多个待录入单元格;

40、将每个所述待录入单元格对应的图像拆分为多个待录入单元格图像,并标记出每个所述待录入单元格图像对应的参数信息;

41、将每个所述待录入单元格图像与所述参数信息一一配对组合得到所述样本图像,将多个所述样本图像进行保存,得到所述模板数据库。

42、第二方面,本专利技术实施例提供一种油气站数据自动录入装置,包括:

43、获取模块,用于获取表格图像,所述表格图像为油气站数据表格的图像,所述表格图像至少包括一个单元格;

44、直线检测模块,用本文档来自技高网...

【技术保护点】

1.一种油气站数据自动录入方法,其特征在于,所述方法包括:

2.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述获取表格图像,包括:

3.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述表格图像为第一颜色空间的图像,所述对所述表格图像进行直线检测,得到所述表格图像的轮廓数据和第一单元格图像,包括:

4.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述将所述第一单元格图像中所有单元格对应的图像进行拆分,得到多个第二单元格图像,包括:

5.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述计算所述第一单元格图像与多个样本图像之间的单元格相似度,确定目标样本图像,将所述目标样本图像的参数信息作为目标参数信息,包括:

6.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述基于所述目标样本图像中多个所述样本单元格的位置信息,将所述文本信息填写至所述目标样本图像中每个所述样本单元格处,作为数据录入结果,包括:

7.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述样本图像是从包含多种不同类型表格图像的模板数据库中获取的,所述模板数据库是通过以下方法建立的:

8.一种油气站数据自动录入装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-7中任一项所述的油气站数据自动录入方法。

...

【技术特征摘要】

1.一种油气站数据自动录入方法,其特征在于,所述方法包括:

2.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述获取表格图像,包括:

3.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述表格图像为第一颜色空间的图像,所述对所述表格图像进行直线检测,得到所述表格图像的轮廓数据和第一单元格图像,包括:

4.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述将所述第一单元格图像中所有单元格对应的图像进行拆分,得到多个第二单元格图像,包括:

5.根据权利要求1所述的油气站数据自动录入方法,其特征在于,所述计算所述第一单元格图像与多个样本图像之间的单元格相似度,确定目标样本图像,将所述目标样本图像的参数信息...

【专利技术属性】
技术研发人员:陈友明陈思竹姜超
申请(专利权)人:四川弘和数智集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1