System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及文本识别,特别涉及电力调度指令票识别方法和系统。
技术介绍
1、目前,利用计算机自动识别字符的技术,文本识别是模式识别应用的一个重要领域。文本识别在生产和生活中需要处理大量的文字、报表和文本的场景下效果尤为显著。
2、现有技术中,文本识别主要识别的是文字,没有关注文本的结构,从而识别后的文字可能会造成文字所表达的意思错误或失真,存在识别文字后不能按照文本结构输出文本的问题。
3、例如,一种在中国专利文献上公开的“文字识别方法和装置”,其公告号:cn105989341a,其申请日:2015年02月17日,该专利技术包含文字的图像中提取多个连通部件;对多个连通部件进行分类,以生成第一语言连通部件和/或非第一语言连通部件;将第一语言连通部件聚类为第一语言文本行,并将非第一语言连通部件聚类为非第一语言文本行;以及从第一语言文本行和非第一语言文本行中识别出第一语言文字和非第一语言文字,但是存在识别文字后不能按照文本结构输出文本的问题。
技术实现思路
1、针对现有技术识别文字后不能按照文本结构输出文本的不足,本专利技术提出了电力调度指令票识别方法和系统,能够识别图像文字并按照文本结构输出文本。
2、以下是本专利技术的技术方案,电力调度指令票识别方法,包括以下步骤:
3、s1:获取电力调度指令票的图像,对图像进行处理;
4、s2:识别图像得到文本框坐标、文字、单元格框坐标和结构序列;
5、s3:基于文本框坐标和
6、s4:结合结构序列导出表格数据。
7、本方案中,通过路径读取图像,对图像进行形态学处理、提取轮廓、透视处理和抗扭曲处理。通过定位网络定位基准点,通过基准点得到文本框坐标和单元格框坐标,通过单向gru的序列模型识别文字,根据单元格框坐标和数字标识得到结构序列,将文本框坐标和单元格框坐标进行匹配,将属于同一单元格的文本拼接在一起,将识别的内容输出成指定文档。能够识别图像文字并按照文本结构输出文本。
8、作为优选,步骤s1中,图像处理包括:调整图像大小、形态学处理、提取轮廓、透视处理和抗扭曲处理。
9、本方案中,对图像进行等比缩放,重新设置图像的宽度和高度的比例与之前保持一致,满足图像处理的预设要求,对图像进行形态学处理,包括颜色空间转换,即彩色转灰度,然后对图像进行高斯滤波操作,令图像模糊,去除图像噪音信息,最后计算出边缘信息,阈值设置为100。形态学处理还包括二值变换等。提取图像最外面的轮廓,保证图像的完整性,获取若干个轮廓,按照轮廓面积由大到小进行排序。分别获取轮廓左上、左下、右上和右下四个点,以这四个点构建面积最小的矩形,并以该矩形为处理后图像。调用deskew函数,对图像(灰度图)进行抗扭曲处理,使图像位置摆正,完成图像的处理。能调整图像的角度并将图像处理成便于识别的图像。
10、作为优选,步骤s2中,获取文本框坐标和单元格框坐标的步骤如下:
11、s201:基于图像上下文定位基准点;
12、s202:根据基准点计算tps变换的参数并生成采样网格;
13、s203:基于采样网格将图像定义成包含m×n个单元格的矩阵;
14、s204:在矩阵中获取单元格框和文本框的左上、左下、右上和右下的四个基准点坐标。
15、本方案中,基于图像上下文定位基准点,基准点用于标识文本和单元格,根据基准点计算tps变换的参数并生成采样网格,提高基准点的精确度,基于采样网格将图像定义成包含m×n个单元格的矩阵,将图像整体设成二维坐标系,便于坐标的表示,在矩阵中获取单元格框和文本框的左上、左下、右上和右下的四个基准点坐标,根据四个基准点坐标即可表示单元格和文本的区域,便于拼接同一单元格的文本内容。
16、作为优选,步骤s2中,获取结构序列的步骤如下:
17、s211:对单元格框进行数字标识,数字标识用于表示单元格框之间的合并情况;
18、s212:将单元格框和数字标识按照先上后下、先左后右的编码顺序进行序列编码。
19、本方案中,用数字标识对单元格框的合并情况,将单元格框和数字标识按照先上后下、先左后右的编码顺序进行序列编码,从而记录结构序列。便于根据结构序列按照文本结构输出文本。
20、作为优选,数字标识中,数字n表示单元格未进行合并,数字n+1表示向左合并单元格,数字n+2表示向上合并单元格;n≥1。
21、本方案中,使用不同的数字标识单元格的合并情况,通过少量标识即可还原图像结构,且数字标识便于计算机识别。
22、作为优选,步骤s1中,获取文字的步骤如下:
23、s221:基于图像上下文定位基准点;
24、s222:根据基准点计算tps变换的参数并生成采样网格;
25、s223:在目标像素附近的像素进行双线性插值得到校正后图像的像素值,基于校正后图像的像素值得到校正图像;
26、s224:从校正图像中提取特征序列;
27、s225:基于特征序列识别文字。
28、本方案中,基于图像上下文定位基准点;根据基准点计算tps变换的参数并生成采样网格;在目标像素附近的像素进行双线性插值得到校正后图像的像素值,基于校正后图像的像素值得到校正图像;从校正图像中提取特征序列;基于特征序列识别文字。能够识别图像的文字。
29、作为优选,步骤s224中,cnn将特征图转化成特征序列,双向lstm分析特征序列的独立性并输出相同长度的特征序列。
30、本方案中,rare的编码器由cnn和双向lstm组成,cnn将特征图转化成序列,序列的长度就是特征图的宽度,即按照从左到右的顺序排列的特征向量。lstm在两个方向上分析一个序列的独立性,并输出另一个同样长度的序列。
31、作为优选,步骤s225中,通过单向gru的序列模型解析特征序列,序列模型的每个单元中有256个记忆块和37个输出单元,37个输出单元分别为:26个字母、10个数字和1个标识。
32、本方案中,解码器是基于单向gru的序列模型,每个单元中有256个记忆块和37个输出单元,37个输出单元分别为:26个字母、10个数字和1个标识。进行特征处理后输出层使用softmax做激活函数。
33、作为优选,步骤s3中,通过重叠度或中心距离匹配文本框坐标和单元格坐标,将单元格中若干个文本从上往下进行拼接。
34、本方案中,将文本框坐标和单元格坐标进行匹配,通过重叠度对文本框和单元格进行匹配,优先匹配重叠度最大的文本框和单元格。若重叠度为零,则匹配中心距离最近的文本框和单元格。将属于同一单元格的文本从上往下拼接在一起,对于多行文本的单元格内容即可拼接成一个字符串。能够拼接同一单元格的文本。
35、电力调度指令票识别系统,包括:图像获取模块,图像获取模块本文档来自技高网...
【技术保护点】
1.电力调度指令票识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤S1中,图像处理包括:调整图像大小、形态学处理、提取轮廓、透视处理和抗扭曲处理。
3.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤S2中,获取文本框坐标和单元格框坐标的步骤如下:
4.根据权利要求1或3所述的电力调度指令票识别方法,其特征在于,步骤S2中,获取结构序列的步骤如下:
5.根据权利要求4所述的电力调度指令票识别方法,其特征在于,数字标识中,数字n表示单元格未进行合并,数字n+1表示向左合并单元格,数字n+2表示向上合并单元格;
6.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤S1中,获取文字的步骤如下:
7.根据权利要求6所述的电力调度指令票识别方法,其特征在于,步骤S224中,CNN将特征图转化成特征序列,双向LSTM分析特征序列的独立性并输出相同长度的特征序列。
8.根据权利要求6或7所述的电力调度指令票识别方法,其特征在于,步骤S
9.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤S3中,通过重叠度或中心距离匹配文本框坐标和单元格坐标,将单元格中若干个文本从上往下进行拼接。
10.电力调度指令票识别系统,适用于权利要求1-9任一项所述的电力调度指令票识别方法,其特征在于,包括:图像获取模块,图像获取模块连接图像处理模块,图像处理模块连接检测识别模块和结构预测模块,检测识别模块和结构预测模块连接内容聚合模块,内容聚合模块连接文本输出模块。
...【技术特征摘要】
1.电力调度指令票识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤s1中,图像处理包括:调整图像大小、形态学处理、提取轮廓、透视处理和抗扭曲处理。
3.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤s2中,获取文本框坐标和单元格框坐标的步骤如下:
4.根据权利要求1或3所述的电力调度指令票识别方法,其特征在于,步骤s2中,获取结构序列的步骤如下:
5.根据权利要求4所述的电力调度指令票识别方法,其特征在于,数字标识中,数字n表示单元格未进行合并,数字n+1表示向左合并单元格,数字n+2表示向上合并单元格;
6.根据权利要求1所述的电力调度指令票识别方法,其特征在于,步骤s1中,获取文字的步骤如下:
7.根据权利要求6所述的电力调度指令票识别方法,其特征在...
【专利技术属性】
技术研发人员:王峰,潘亚男,孙法,王莹,沈利,陈崇芳,
申请(专利权)人:浙江华云信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。