System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于Jetson Nano的电力二次系统端子排图像识别方法及系统技术方案_技高网

一种基于Jetson Nano的电力二次系统端子排图像识别方法及系统技术方案

技术编号:39954037 阅读:17 留言:0更新日期:2024-01-08 23:31
本发明专利技术公开了一种基于Jetson Nano的电力二次系统端子排图像识别方法,涉及计算机视觉技术领域,包括团队拍摄端子排接线图片并使用LabelMe进行标注,构建端子排数据集;在端子排数据集上训练SegLink模型,训练完成后获取标注框的位置信息;使用独字分割网络结构对标注框内的文本进行分割,获得每个独立字符的位置信息;使用文本特征类别和坐标排序算法对标注框进行排序,并将排序结果传输至Jetson Nano开发板;计算两标注框的中点距离,并通过筛选标注框长度和计算差值,对文本识别结果进行二次检验。本发明专利技术应用改进的SegLink检测算法,通过一体化的端到端结构实现文本检测和识别,降低了管道式系统的误差传递风险。

【技术实现步骤摘要】

本专利技术涉及计算机视觉,特别是一种基于jetson nano的电力二次系统端子排图像识别方法及系统。


技术介绍

1、

2、计算机视觉技术的不断进步推动了图像识别和文本识别技术的提升,使其具备了更高的准确率和鲁棒性。在这个领域中,ocr(光学字符识别)技术能够对文本资料进行扫描并进行图像分析处理,从中提取文字和版面信息。目前的ocr算法在处理无噪点干扰或打印清晰的文本时表现出色,准确率非常高。然而,在实验中,模糊的图像或被套管标记遮挡的情况下,准确率就会下降。


技术实现思路

1、鉴于ocr的端子排识别算法在应对图像模糊、遮挡等情况时识别准确率不高的问题,提出了本专利技术。

2、因此,本专利技术所要解决的问题在于如何提高基于深度学习的端子排图像文本检测与识别算法在复杂环境下的鲁棒性和准确率。

3、为解决上述技术问题,本专利技术提供如下技术方案:

4、第一方面,本专利技术实施例提供了一种基于jetson nano的电力二次系统端子排图像识别方法,其包括团队拍摄端子排接线图片并使用labelme进行标注,构建端子排数据集;在端子排数据集上训练seglink模型,训练完成后获取标注框的位置信息;使用独字分割网络结构对标注框内的文本进行分割,以获得每个独立字符的位置信息;使用文本特征类别和坐标排序算法对标注框进行排序,并将排序结果传输至jetson nano开发板;计算两标注框的中点距离,并通过筛选标注框长度和计算差值,对文本识别结果进行二次检验。

5、作为本专利技术所述基于jetson nano的电力二次系统端子排图像识别方法的一种优选方案,其中:在端子排数据集上训练seglink模型包括以下步骤:遍历端子排训练集的每个样本图像,并将其输入到seglink模型的主干网络中进行特征提取;对于每个生成的特征图,根据特征图的大小和步长计算其相对于原始图像的缩放比例;针对每个特征图的每个位置,根据计算得到的缩放比例和默认框的尺寸,在原始图像上生成对应的默认框,并与标注框进行匹配;使用标注框和默认框的匹配信息,计算并更新默认框的偏移量;定义损失函数为位置误差与置信度误差的加权和;对整个端子排训练集进行迭代处理,以获取标注框的位置信息,并使用定义的损失函数更新模型参数。

6、作为本专利技术所述基于jetson nano的电力二次系统端子排图像识别方法的一种优选方案,其中:缩放比例的具体公式如下:

7、

8、其中,sk为特征图的缩放比例,m为特征图个数,smin为最底层缩放比例,smax为最高层缩放比例。

9、

10、其中,sk为特征图的缩放比例,ar为不同的纵横比。

11、作为本专利技术所述基于jetson nano的电力二次系统端子排图像识别方法的一种优选方案,其中:与标注框进行匹配包括以下步骤:计算每个默认框和每个标注框之间的iou交并比;若默认框与标注框有最大交并比,则认为他们匹配成功,并将此默认框设为正样本;对于剩余未匹配的默认框,若默认框与任意一个标注框的最大的交并比iou>0.6时,则认为他们匹配成功,并将此默认框设为正样本;若默认框与某个标注框的iou<0.3,则认为匹配失败,并将此默认框设为负样本;若默认框未被匹配,则将此默认框设为背景样本;对负样本进行抽样,抽样时按照置信度误差进行降序排列,选取置信度小的top-k作为训练的负样本,将正样本与负样本比例设置为1∶3,其他负样本进行丢弃;iou交并比的具体公式如下:

12、

13、其中,a和b分别为默认框和标注框。

14、损失函数的具体公式如下:

15、

16、其中,n为默认框的正样本数量,lloc为位置误差,lconf为置信度误差,c为类别置信度预测值,l为默认框的所对应标注框的位置预测值,而g是标注框的位置参数,α为权重系数,x是默认框与真实标记框的匹配情况。

17、作为本专利技术所述基于jetson nano的电力二次系统端子排图像识别方法的一种优选方案,其中:使用文本特征类别和坐标排序算法对标注框进行排序包括以下步骤:获取每个独立字符的位置信息包括边界框的位置和大小;对根据位置信息的边界框进行坐标排序,以确保按照从左到右、从上到下的顺序遍历;遍历排序后的边界框,提取每个边界框中的字符图像,并根据字符的文字特征进行分类;对于每类字符的边界框,提取标注框的中点坐标,并使用坐标排序算法根据中点坐标对标注框进行排序;得到每类字符的排序结果,并将排序结果传输至jetson nano开发板。

18、作为本专利技术所述基于jetson nano的电力二次系统端子排图像识别方法的一种优选方案,其中:对文本识别结果进行二次检验包括以下步骤:计算两标注框的中点距离δd;定义两标注框的中点距离δd允许的最大误差t1和最小误差t2;根据中点距离δd的最大误差和最小误差判断是否有遗漏的文本,并进行二次检验判断;基于ocr识别和标注补充的结果输出修正后的标注框和识别文本结果;定义两标注框的中点距离δd允许的最大误差t1和最小误差t2包括以下步骤:若δd最大误差t1不超过y9-y2且δd最小误差t2不超过y7-y4,则中间无漏检的目标物;若δd最大误差t1超过y9-y2或δd最小误差t2超过y7-y4,且标注框之上有另一标注框存在,则中间存在漏检测,进入二次检验。

19、作为本专利技术所述基于jetson nano的电力二次系统端子排图像识别方法的一种优选方案,其中:对文本识别结果进行二次检验还包括以下步骤:对检测结果进行复查,通过加载模型检测过的图片,以照片左下角为原点建立平面坐标系;定义标注框左上为an、右上为bn、左下为cn、右下为dn,遍历定义图片中每个框;筛选出ab长度远大于ac的框,计算an-an-1,得到一个值sn;若值sn在小范围变化即为非漏检图片,若出现1.5至2倍大小的变化,则记为漏检图片,将文件名后缀添加符号“_f”;通过集成部分模型读取后缀带有“_f”的图片进行二次检测,检测出检测缺少的部分。

20、第二方面,本专利技术实施例提供了一种基于jetson nano的电力二次系统端子排图像识别系统,其包括数据收集和标注模块,用于拍摄端子排接线图片并使用labelme进行标注,构建端子排数据集;seglink模型训练模块,用于使用端子排数据集对seglink模型进行训练,获取标注框的位置信息;独字分割网络结构模块,用于使用独字分割网络结构对标注框内的文本进行分割,获得每个独立字符的位置信息;标注框排序和分类模块,用于对标注框进行排序,并根据文字特征进行分类,包括端子序号、分组标记和套管标记;识别结果二次检验模块,用于计算两个标注框的中点距离,根据定义的最大误差和最小误差判断是否有遗漏的文本,并进行二次检验。

21、第三方面,本专利技术实施例提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其中:所述计算机程序指令被处理器执行时实现如本专利技术第本文档来自技高网...

【技术保护点】

1.一种基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:包括,

2.如权利要求1所述的基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:所述在端子排数据集上训练SegLink模型包括以下步骤:

3.如权利要求2所述的基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:所述缩放比例的具体公式如下:

4.如权利要求2所述的基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:所述与标注框进行匹配包括以下步骤:

5.如权利要求1所述的基于JetsonNano的电力二次系统端子排图像识别方法,其特征在于:所述使用文本特征类别和坐标排序算法对标注框进行排序包括以下步骤:

6.如权利要求1所述的基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:所述对文本识别结果进行二次检验包括以下步骤:

7.如权利要求1所述的基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:所述对文本识别结果进行二次检验还包括以下步骤:

8.一种基于Jetson Nano的电力二次系统端子排图像识别系统,基于权利要求1~7任一所述的基于Jetson Nano的电力二次系统端子排图像识别方法,其特征在于:还包括,

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于:所述处理器执行所述计算机程序时实现权利要求1~7任一所述的基于Jetson Nano的电力二次系统端子排图像识别方法的步骤。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1~7任一所述的基于Jetson Nano的电力二次系统端子排图像识别方法的步骤。

...

【技术特征摘要】

1.一种基于jetson nano的电力二次系统端子排图像识别方法,其特征在于:包括,

2.如权利要求1所述的基于jetson nano的电力二次系统端子排图像识别方法,其特征在于:所述在端子排数据集上训练seglink模型包括以下步骤:

3.如权利要求2所述的基于jetson nano的电力二次系统端子排图像识别方法,其特征在于:所述缩放比例的具体公式如下:

4.如权利要求2所述的基于jetson nano的电力二次系统端子排图像识别方法,其特征在于:所述与标注框进行匹配包括以下步骤:

5.如权利要求1所述的基于jetsonnano的电力二次系统端子排图像识别方法,其特征在于:所述使用文本特征类别和坐标排序算法对标注框进行排序包括以下步骤:

6.如权利要求1所述的基于jetson nano的电力二次系统端子排图像识别方法,其特征在于:...

【专利技术属性】
技术研发人员:王磊张礼波宁楠黄力陈刚付同福晏丽丽夏添郝丽萍张广梅王永军田雨周兵王东张建行何进锋邹瑞睿蔡顺香喻绍鸿杨敏雪庞钫晟胡元赢郑松王涛黄伟黄照厅牟楠张雪清朱皓杨凯利白加林邬小坤朱平陈相吉赵庆营李洪波
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1