基于VIT的电力缆线位置检测方法、电子设备及介质技术

技术编号:37623646 阅读:11 留言:0更新日期:2023-05-18 12:15
本申请实施例公开了一种基于VIT的电力缆线位置检测方法、电子设备及介质,能够利用预先训练的VIT检测模型准确检测出高空电力缆线位置,并且,由于VIT检测模型中具有注意力机制,无需先验知识,通过transformer编解码结构保证全局建模能力,通过二分图匹配优化保证预测和人工标注一一对应,可以直接得到目标检测框和类别属性,在应对室外场景下的电力缆线检测中具备更高的鲁棒性及更强的泛化能力。测中具备更高的鲁棒性及更强的泛化能力。测中具备更高的鲁棒性及更强的泛化能力。

【技术实现步骤摘要】
基于VIT的电力缆线位置检测方法、电子设备及介质


[0001]本申请涉及人工智能
,尤其涉及一种基于VIT的电力缆线位置检测方法、电子设备及介质。

技术介绍

[0002]随着高新技术的快速发展以及在各行业的落地应用,高空电力作业正在逐步由人工化转向自动化、智能化,从而达到电网公司减员增效降风险的要求。智能化作业需要对高空电力缆线的位置进行精确检测,该检测结果可以进一步辅助相机进行三维定位。
[0003]但是,由于室外场景下光照变化不定,高架线附近的各种金属制品存在反光等干扰,传统的基于几何特性的视觉检测方法无法应对这样复杂的情况,而基于CNN(Convolutional Neural Networks,卷积神经网络)的深度学习检测方法通常过于依赖某个局部信息,从而导致一定程度的不可靠性,且主流的目标检测算法,如Faster

RCNN(Faster

Regions with CNN features,快速区域卷积神经网络)或者YOLO(You Only Look Once)系列算法,由于需要设置先验anchor以及nms(non maximum suppression,非极大抑制),需要训练的超参数较多,在工程实现上更加复杂。

技术实现思路

[0004]本申请实施例提供了一种基于VIT的电力缆线位置检测方法、电子设备及介质,可以精确的检测出高空下的电力缆线位置。
[0005]第一方面,本申请实施例提供了一种基于VIT的电力缆线位置检测方法,所述基于VIT的电力缆线位置检测方法包括:
[0006]获取电力缆线图像,并获取预先训练的VIT检测模型;
[0007]利用所述VIT检测模型的骨架网络对所述电力缆线图像进行特征提取,得到所述电力缆线图像的目标图像特征;
[0008]对所述目标图像特征进行位置编码,得到目标位置编码向量;
[0009]利用所述VIT检测模型的编码器结构对所述目标图像特征及所述目标位置编码向量进行编码,得到目标编码特征;
[0010]利用所述VIT检测模型的解码器结构及object queries对所述目标编码特征进行解码,得到目标解码特征;
[0011]将所述目标解码特征输入至所述VIT检测模型的分类和回归head模块,得到所述电力缆线图像中的缆线预测位置。
[0012]第二方面,本申请实施例还提供了一种基于VIT的电力缆线位置检测装置,所述基于VIT的电力缆线位置检测装置包括:
[0013]获取单元,用于获取电力缆线图像,并获取预先训练的VIT检测模型;
[0014]提取单元,用于利用所述VIT检测模型的骨架网络对所述电力缆线图像进行特征提取,得到所述电力缆线图像的目标图像特征;
[0015]编码单元,用于对所述目标图像特征进行位置编码,得到目标位置编码向量;
[0016]所述编码单元,还用于利用所述VIT检测模型的编码器结构对所述目标图像特征及所述目标位置编码向量进行编码,得到目标编码特征;
[0017]解码单元,用于利用所述VIT检测模型的解码器结构及object queries对所述目标编码特征进行解码,得到目标解码特征;
[0018]预测单元,用于将所述目标解码特征输入至所述VIT检测模型的分类和回归head模块,得到所述电力缆线图像中的缆线预测位置。
[0019]第三方面,本申请实施例还提供了一种电子设备,其包括存储器,存储至少一个指令;及处理器,执行所述存储器中存储的指令以实现上述方法。
[0020]第四方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述方法。
[0021]本申请实施例提供了一种基于VIT的电力缆线位置检测方法、电子设备及介质。具有以下有益效果:利用预先训练的VIT检测模型准确检测出高空电力缆线位置,并且,由于VIT检测模型中具有注意力机制,无需先验知识,通过transformer编解码结构保证全局建模能力,通过二分图匹配优化保证预测和人工标注一一对应,可以直接得到目标检测框和类别属性,在应对室外场景下的电力缆线检测中具备更高的鲁棒性及更强的泛化能力。
附图说明
[0022]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0023]图1为本申请实施例提供的基于VIT的电力缆线位置检测方法的一个流程示意图;
[0024]图2为本申请实施例提供的基于VIT的电力缆线位置检测装置的一个功能模块示意图;
[0025]图3为本申请实施例提供的电子设备的一个示意性框图。
具体实施方式
[0026]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0027]应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
[0028]还应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0029]还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是
指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0030]本申请实施例提供了一种基于VIT(VisionTransformer,视觉转换器)的高空电力缆线位置检测方法、电子设备及介质,其中,所述方法可以应用于基于VIT的电力缆线位置检测装置。
[0031]该基于VIT的电力缆线位置检测方法的执行主体可以是本申请实施例提供的基于VIT的电力缆线位置检测装置,或者集成了该基于VIT的电力缆线位置检测装置的电子设备,其中,该基于VIT的电力缆线位置检测装置可以采用硬件或者软件的方式实现,该电子设备可以为检测仪等,具体可以为检测仪中的操控设备,或者与该操控设备具有通信连接的终端或服务器。
[0032]请参阅图1,图1为本申请实施例提供的基于VIT的电力缆线位置检测方法的一个流程示意图。本申请实施例提供的基于VIT的电力缆线位置检测方法可以应用于基于VIT的电力缆线位置检测装置。当然,在其他实施例中,所述基于VIT的电力缆本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于VIT的电力缆线位置检测方法,其特征在于,所述基于VIT的电力缆线位置检测方法包括:获取电力缆线图像,并获取预先训练的VIT检测模型;利用所述VIT检测模型的骨架网络对所述电力缆线图像进行特征提取,得到所述电力缆线图像的目标图像特征;对所述目标图像特征进行位置编码,得到目标位置编码向量;利用所述VIT检测模型的编码器结构对所述目标图像特征及所述目标位置编码向量进行编码,得到目标编码特征;利用所述VIT检测模型的解码器结构及object queries对所述目标编码特征进行解码,得到目标解码特征;将所述目标解码特征输入至所述VIT检测模型的分类和回归head模块,得到所述电力缆线图像中的缆线预测位置。2.如权利要求1所述的基于VIT的电力缆线位置检测方法,其特征在于,在获取预先训练的VIT检测模型前,所述方法还包括:利用图像采集装置采集不同环境条件下的缆线RGB图像构建待标注图像集,并获取初始VIT模型及预先构建的损失函数;对所述待标注图像集中的每张待标注图像进行标注,得到样本图像集合;利用所述样本图像集合训练所述初始VIT模型,并在训练过程中检测所述损失函数是否达到收敛;当检测到所述损失函数达到收敛时,停止训练,得到所述VIT检测模型;其中,所述环境条件包括光线、背景及空间位置。3.如权利要求2所述的基于VIT的电力缆线位置检测方法,其特征在于,所述对所述待标注图像集中的每张待标注图像进行标注包括:在距离防震锤预设距离处对所述待标注图像集中的每张待标注图像进行标注。4.如权利要求2所述的基于VIT的电力缆线位置检测方法,其特征在于,所述在训练过程中检测所述损失函数是否达到收敛包括:获取每轮训练时模型输出的无序集合,并从所述无序集合中提取多个前景类别及对应的感兴趣区域框;从所述样本图像集合中获取与所述多个前景类别及对应的感兴趣区域框具有对应关系的多个标记类别及对应的标记框;将每个前景类别及对应的感兴趣区域框组合为一组特征,得到多组输出特征;将每个标记类别及对应的标记框组合为一组特征,得到多组标记特征;利用双边匹配算法对所述多组输出特征与所述多组标记特征进行索引匹配,得到每轮训练得到的最优二元匹配特征;基于每轮训练得到的最优二元匹配特征计算预测类别损失与边界框预测损失的和,得到每轮训练得到的目标损失;在训练过程中,当检测到所述目标损失不再减小时,确定检测到所述损失函数达到收敛;其中,所述预测类别损失根据预测概率最高...

【专利技术属性】
技术研发人员:李东有王志强孙琰陈志忠雷思宇于洪涛张航李刚耿建宇闫旭李雪峰杨钧砚杜伟姜泓杉杜英杰张凯何昊韩冬
申请(专利权)人:国网吉林省电力有限公司长春供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1