System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及铭牌检测,具体涉及一种电力设备铭牌端对端ocr文字识别方法及系统。
技术介绍
1、随着电网规模的日益扩大,电力设备的种类、数量越来越庞大。设备铭牌记录着设备的基本参数和身份信息,对电力设备进行统计、管理、巡检时常常需要获取设备的铭牌信息,目前对铭牌识别的相关研究较少且主要针对没有任何背景影响的铭牌图像,其识别方法主要分两类。
2、其中一类是利用ocr (optical character recognition,光学字符识别)软件,将采集到的铭牌图像进行图像增强,通过边框定位铭牌,之后进行二值化处理,最后输入到ocr软件中进行字符识别,另一类采用传统的图像处理方法,通过图像预处理消除图像噪声,将文本分割成单个字符,再提取字符特征建立模板,最后采用字符模板匹配方法进行识别,其中所选取的特征算子是关键,分别选取字符经过 cabor 变换的纹理特征、字符的小波能量以及字符的开闭环特征来识别字符,这些方法选取的特征算子往往不能全面地体现字符特征信息。
3、ocr识别方法在进行使用时,当输入的铭牌图像出现挤压形成的褶皱、倾斜或者图像模糊等现象时,会严重影响的ocr识别的准确性,使得识别的文字与原本的含义相差较大,从而不利于对铭牌进行识别。
4、现有公开号为“cn114863084a”的一种基于深度学习目标检测的铭牌识别及挂靠设备,公开了一种基于深度学习目标检测的铭牌识别及挂靠设备,其特征在于:包括机器人本体、铭牌取放装置、铭牌除灰装置、铭牌挂靠装置;铭牌取放装置、铭牌除灰装置、铭牌挂靠装置
技术实现思路
1、本专利技术解决了目前的铭牌识别方法准确性不高的问题,提出一种电力设备铭牌端对端ocr文字识别方法及系统,有效识别铭牌文本框中的内容,增加文字识别的准确率。
2、为了实现上述目的,本专利技术采用以下技术方案:一种电力设备铭牌端对端ocr文字识别方法,包括以下步骤:
3、s1,对电力设备的铭牌进行深度清理,并采集关于电力设备的铭牌的图像;
4、s2,根据铭牌文字间的固定间隙和固定行距将图像的内容区划分为若干个文本框;
5、s3,对文本框有缺陷的图像进行预处理,得到预处理文本框以及预处理图像;
6、s4,根据ocr识别引擎对预处理图像进行文字识别,得到最终的识别结果。
7、本技术方案中,首先利用清洁剂来对铭牌的表面进行深度清理,从而便于对铭牌进行拍摄,增加照片的清晰度,之后再利用铭牌文字的文字间距和行距来对铭牌的文字进行区别,使得文字组成不同的文本框,而每个文本框内为铭牌中所要表达的一个含义,从而对铭牌的文字进行分类,而针对被挤压的铭牌、倾斜的铭牌和不完整的铭牌,通过文字之间的间距以及行距可以有效的对文本框进行拉伸以及调整,最后根据ocr识别引擎对预处理图像进行文字识别,进而有效的对文本框内的内容进行识别,增加文字识别的准确率。
8、本专利技术还进一步设置为:所述步骤s2包括以下步骤:
9、s21,提取图像的内容区,将铭牌文字的固定间距和固定行距与图像的内容区文字的间距和行距进行比对判断;
10、s22,根据比对判断的结果将图像的内容区划分为不同种类的文本框。
11、本技术方案中,首先对图像进行提取处理,提取出关于图像的内容区,内容区即包括有铭牌文件的区域,在常规的铭牌上,为方便铭牌的阅读,例如名称以及编号的文字之间的间距和行距是固定的,且名称内部的行距和间距与名称和编号之间的行距和间距是不相同的,基于上述的行距和间距来进行与实时采集得到的图像上的文件间距和行距进行比对判断,划分为若干个不同种类的文本框。
12、本专利技术还进一步设置为:所述文本框包括
13、被挤压的文本框,当图像的内容区文本框内的文字间距小于设定的最小文字间距时,则说明铭牌表面出现褶皱,该文本框标识为被挤压的文本框;
14、倾斜的文本框,文本框内部的文字、文字的间距和行距发生倾斜,即标记为倾斜的文本框;
15、不完整的文本框,文本框内的文字出现部分模糊时,标注为不完全文本框。
16、本技术方案中,文本框主要划分为若干类,即被挤压的文本框、倾斜的文本框以及不完整的文本框,这些均为有缺陷的图像,此外,还包括正常的文本框,正常的文本框则无需进行后续的预处理。
17、本专利技术还进一步设置为:所述步骤s3包括以下步骤:
18、s31,对被挤压的文本框中文字间距过小的部分进行拉伸处理,形成预处理文本框及预处理图像;
19、s32,对倾斜的文本框进行角度调整,完整角度调整后对文本框进行识别,校验其是否调整准确,若校验完成,则形成预处理文本框及预处理图像;
20、s33,对不完整的文本框进行背景颜色更换,在不同颜色背景对模糊文字进行捕捉,形成预处理文本框及预处理图像。
21、本技术方案中,分别对三种有缺陷的图像进行预处理,经过预处理的文本框以及图像变成正常的文本框,方便后续的识别处理。
22、本专利技术还进一步设置为:所述步骤s4包括以下步骤:
23、根据ocr识别引擎对预处理图像进行文字识别,最后进行对照识别校验,得到最终的文字识别结果。
24、本技术方案中,经过ocr识别引擎以及进行对照识别校验之后,能够得到识别结果,从而正确且有效的完成铭牌的识别。
25、本专利技术还进一步设置为:所述深度清理包括以下步骤:
26、s11,对铭牌进行冲洗和涂刷,并重复若干次;
27、s12,通过特制的清洁剂对铭牌进行清洁后,对铭牌进行再次涂刷和再次冲洗。
28、本技术方案中,反复多次对铭牌进行冲洗和涂刷,使得粘连在铭牌表面的杂质与铭牌分离,从而使铭牌表面不便于去除的油渍和锈迹暴露出铭牌表面;随后通过清洁剂使铭牌表面的油渍和锈迹进行反应,之后再次进行涂刷和冲洗,确保反应完毕的油渍和锈迹被完全去除。
29、本专利技术还进一步设置为:所述冲洗具体采用冲洗机器人,所述涂刷具体采用涂刷机器人。
30、本技术方案中,采用冲洗机器人以及涂刷机器人来对铭牌表面进行自动清洁。
31、一种电力设备铭牌端对端ocr文字识别系统,使用上述的一种电力设备铭牌端对端ocr文字识别方法,包括:
32、采集模块,采集电力设备铭牌图像;
33、划分模块,将图像的内容区划分为若干个文本框;
34、预处理模块,对文本框有缺陷的图像进行预处理操作;
35、ocr识别模块,利用ocr进行文字识别,得到最终的识别结果。
36、本技术方案中,采集模块与划分模块连接,划分模块与预处理模块连接,预处理模块与ocr识别模块连接。
37、本专利技术还进一步设置为:还包括清洗模块,所述清洗模块包括冲洗机器人和本文档来自技高网...
【技术保护点】
1.一种电力设备铭牌端对端OCR文字识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,所述步骤S2包括:
3.根据权利要求1或2所述的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,所述文本框包括:
4.根据权利要求3所述的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,所述步骤S3包括:
5.根据权利要求1或2或4所述的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,所述步骤S4包括:
6.根据权利要求1所述的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,所述深度清理包括:
7.根据权利要求6所述的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,所述冲洗具体采用冲洗机器人,所述涂刷具体采用涂刷机器人。
8.一种电力设备铭牌端对端OCR文字识别系统,使用权利要求1-7任一项的一种电力设备铭牌端对端OCR文字识别方法,其特征在于,包括:
9.根据权利要求8所述的一种电力设备铭牌端对端OCR文
...【技术特征摘要】
1.一种电力设备铭牌端对端ocr文字识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种电力设备铭牌端对端ocr文字识别方法,其特征在于,所述步骤s2包括:
3.根据权利要求1或2所述的一种电力设备铭牌端对端ocr文字识别方法,其特征在于,所述文本框包括:
4.根据权利要求3所述的一种电力设备铭牌端对端ocr文字识别方法,其特征在于,所述步骤s3包括:
5.根据权利要求1或2或4所述的一种电力设备铭牌端对端ocr文字识别方法,其特征在于,所述步骤s4包括:
6.根据权利要求1所述的一种电力设备铭...
【专利技术属性】
技术研发人员:李杨,莫加杰,王勇,董元龙,林明晖,岳衡,丁靖,任学海,王刘俊,李倩,陈瑜,高瞻,王骊,柴连兴,单宝旭,李岩,卢迪,张成威,
申请(专利权)人:国网浙江省电力有限公司嘉兴供电公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。