System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于注意力机制的轻量级轨道异物检测方法技术_技高网

基于注意力机制的轻量级轨道异物检测方法技术

技术编号:41339666 阅读:6 留言:0更新日期:2024-05-20 09:57
本发明专利技术公开了基于注意力机制的轻量级轨道异物检测方法,具体包括以下步骤:步骤一:采用轻量级的MobilNetV3作为特征提取网络;步骤二:使用Split‑Attention注意力模块来替代传统的SE注意力机制;步骤三:在上采样过程中,采用Carafe模块进行特征恢复。本发明专利技术公开的基于注意力机制的轻量级轨道异物检测方法在传统CenterNet网络的基础上,使用体积较小的MobilNetV3作为骨干网络,实现在轨道异物中轻量级的特征提取,将Split‑Attention注意力机制模块替换原有的SE注意力机制模块,通过不同的子集计算注意力权重,从而更加准确地捕捉特征之间的关系,提高检测精度,在反卷积模块Deconv对特征图进行上采样中提出Carafe模块以更好的恢复轨道异物的详细特征,在降低模型参数的同时提高检测精度。

【技术实现步骤摘要】

本专利技术涉及铁路运输,尤其涉及基于注意力机制的轻量级轨道异物检测方法


技术介绍

1、随着现代城市化和工业化的飞速推进,铁路运输作为高效、可靠且安全的交通方式,在各个领域得到广泛应用,对社会经济发展起着不可替代的重要作用。然而,在轨道交通运营的过程中,轨道异物入侵成为一种潜在的安全隐患,可能导致轨道交通事故。轨道异物入侵包括行人、车辆、动物等非法越界进入列车限界区域,以及自然灾害引起的轨道掩埋,例如落石、泥石流等事件,这些都对轨道交通的安全构成严重威胁。因此,实现对轨道上异物的快速准确识别和定位对于保障铁路交通运输的安全至关重要。然而,由于轨道环境的特殊性,如不均匀的光照、遮挡和复杂的背景等因素,轨道异物识别仍然面临着准确性和鲁棒性方面的巨大挑战。

2、为了解决这些问题,目前大多数铁路部门采用巡检车进行异物检测。这些方法主要通过轨道巡检设备实时监测轨道状况,采用目视或传感器等方式进行异物检测。此外,在一些复杂地貌环境下的铁路环境安全监测中,还使用卫星、无人机、传感器、红外光幕等遥感技术,对轨道进行高分辨率、全方位的检测,以实现对轨道状态的有效监测和动态管理。例如,在轨道枕木上贴附mems加速度传感器,通过采集运行状态参数如光滑度、空余度等,建立模型并提取特征进行异常识别,为轨道状态的智能监测和管理提供技术手段。然而,这些方法或多或少需要人工参与,并且对于异物的体积和高度有一定的要求,容易导致小目标物体漏检和错检的问题。


技术实现思路

1、本专利技术公开基于注意力机制的轻量级轨道异物检测方法,旨在解决
技术介绍
中提出的这些方法或多或少需要人工参与,并且对于异物的体积和高度有一定的要求,容易导致小目标物体漏检和错检的技术问题。

2、为了实现上述目的,本专利技术采用了如下技术方案:

3、基于注意力机制的轻量级轨道异物检测方法,具体包括以下步骤:

4、步骤一:采用轻量级的mobilnetv3作为特征提取网络;

5、步骤二:使用split-attention注意力模块来替代传统的se注意力机制;

6、步骤三:在上采样过程中,采用carafe模块进行特征恢复。

7、在一个优选的方案中,所述mobilnetv3在mobilnetv2的基础上使用了非线性激活函数hard-swish并且提出的具有线性瓶颈的反向残差结构,并且引入了基于注意力机制的压缩和激励模块,hard-swish激活函数是一种非线性激活函数,函数在swish激活函数的基础上,加入了硬性截断函数,使得激活函数更加稀疏,减少了计算量和内存占用,hard-swish激活函数如以下公式所示:

8、f(x)=x·min(1,max(0,x+3)/6);

9、其中max(0,x+3)/6是硬性截断函数,其使得激活函数在x∈[-3,3]的范围内变得非常稀疏,所述se注意力机制是在特征图上进行通道注意力,即对每个特征图的通道进行加权,使得网络更关注重要的特征,减少特征之间的冗余,提高网络性能,bottleneck结构使用的深度可分离卷积,通过将空间滤波与特征生成机制分离,将卷积操作分解成两个步骤,深度卷积和逐点卷积,该结构先使用1x1卷积核进行通道数压缩,再使用3x3卷积核进行特征提取,最后使用1x1卷积核进行通道数扩展。

10、在一个优选的方案中,所述步骤二中,mobilnetv3中se模块通过自适应地调整通道的权重来增强重要特征,split-attention模块保持计算精度的同时,充分利用特征图中的信息,所述split-attention将注意力机制分为两个部分,分别是通道注意力和空间注意力,所述通道注意力用于对通道维度的特征进行注意力加权,且空间注意力用于对空间维度的特征进行注意力加权,所述split-attention模块的理论公式如下式所示:

11、

12、式中

13、y——输出特征

14、σ——sigmoid函数

15、wi——通道注意力权重

16、xi——通道特征

17、x——输入的特征向量

18、所述split-attention模块的关键在于将通道分组后,分别计算其注意力值,并对不同的组进行融合。

19、在一个优选的方案中,所述carafe的网络结构包含两个关键模块:上采样核预测模块和特征重组模块,在上采样核预测模块中,输入特征图首先通过卷积层映射到一个d维的特征空间,通过全连接层将其映射到一个k维的上采样核空间,其中k表示上采样核的通道数,通过点积操作将上采样核空间与特征空间相结合,得到一个h×w×k的上采样核张量,其中每个位置上的k维向量表示该位置上的上采样核,所述特征重组模块接受一个h×w×c的输入特征图和一个h×w×k的上采样核张量,通过卷积操作得到一个h×w×(c×k)的张量,通过reshape操作将该张量转换为h×w×c×k的形式,其中每个位置上的c×k维向量表示特征重组后的向量,通过对通道维度进行求和操作,得到一个h×w×c的特征图,carafe通过特征图生成上采样核,然后利用该核与原始图像进行特征重组。

20、由上可知,本专利技术提供的基于注意力机制的轻量级轨道异物检测方法具有,所述特征重组模块接受一个h×w×c的输入特征图和一个h×w×k的上采样核张量,通过卷积操作得到一个h×w×(c×k)的张量,通过reshape操作将该张量转换为h×w×c×k的形式,其中每个位置上的c×k维向量表示特征重组后的向量,通过对通道维度进行求和操作,得到一个h×w×c的特征图,carafe通过特征图生成上采样核,然后利用该核与原始图像进行特征重组的技术效果。

本文档来自技高网...

【技术保护点】

1.基于注意力机制的轻量级轨道异物检测方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述MobilNetV3在MobilNetV2的基础上使用了非线性激活函数Hard-Swish并且提出的具有线性瓶颈的反向残差结构,并且引入了基于注意力机制的压缩和激励模块。

3.根据权利要求2所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,Hard-Swish激活函数是一种非线性激活函数,函数在Swish激活函数的基础上,加入了硬性截断函数,使得激活函数更加稀疏,减少了计算量和内存占用,Hard-Swish激活函数如以下公式所示:

4.根据权利要求3所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述SE注意力机制是在特征图上进行通道注意力,即对每个特征图的通道进行加权,使得网络更关注重要的特征,减少特征之间的冗余,提高网络性能,Bottleneck结构使用的深度可分离卷积,通过将空间滤波与特征生成机制分离,将卷积操作分解成两个步骤,深度卷积和逐点卷积,该结构先使用1x1卷积核进行通道数压缩,再使用3x3卷积核进行特征提取,最后使用1x1卷积核进行通道数扩展。

5.根据权利要求1所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述步骤二中,MobilNetV3中SE模块通过自适应地调整通道的权重来增强重要特征,Split-Attention模块保持计算精度的同时,充分利用特征图中的信息,所述Split-Attention将注意力机制分为两个部分,分别是通道注意力和空间注意力,所述通道注意力用于对通道维度的特征进行注意力加权,且空间注意力用于对空间维度的特征进行注意力加权。

6.根据权利要求5所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述Split-Attention模块的理论公式如下式所示:

7.根据权利要求1所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述Carafe的网络结构包含两个关键模块:上采样核预测模块和特征重组模块,在上采样核预测模块中,输入特征图首先通过卷积层映射到一个D维的特征空间,通过全连接层将其映射到一个K维的上采样核空间,其中K表示上采样核的通道数,通过点积操作将上采样核空间与特征空间相结合,得到一个H×W×K的上采样核张量,其中每个位置上的K维向量表示该位置上的上采样核。

8.根据权利要求7所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述特征重组模块接受一个H×W×C的输入特征图和一个H×W×K的上采样核张量,通过卷积操作得到一个H×W×(C×K)的张量,通过reshape操作将该张量转换为H×W×C×K的形式,其中每个位置上的C×K维向量表示特征重组后的向量,通过对通道维度进行求和操作,得到一个H×W×C的特征图,Carafe通过特征图生成上采样核,然后利用该核与原始图像进行特征重组。

...

【技术特征摘要】

1.基于注意力机制的轻量级轨道异物检测方法,其特征在于,具体包括以下步骤:

2.根据权利要求1所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述mobilnetv3在mobilnetv2的基础上使用了非线性激活函数hard-swish并且提出的具有线性瓶颈的反向残差结构,并且引入了基于注意力机制的压缩和激励模块。

3.根据权利要求2所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,hard-swish激活函数是一种非线性激活函数,函数在swish激活函数的基础上,加入了硬性截断函数,使得激活函数更加稀疏,减少了计算量和内存占用,hard-swish激活函数如以下公式所示:

4.根据权利要求3所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述se注意力机制是在特征图上进行通道注意力,即对每个特征图的通道进行加权,使得网络更关注重要的特征,减少特征之间的冗余,提高网络性能,bottleneck结构使用的深度可分离卷积,通过将空间滤波与特征生成机制分离,将卷积操作分解成两个步骤,深度卷积和逐点卷积,该结构先使用1x1卷积核进行通道数压缩,再使用3x3卷积核进行特征提取,最后使用1x1卷积核进行通道数扩展。

5.根据权利要求1所述的基于注意力机制的轻量级轨道异物检测方法,其特征在于,所述步骤二中,mobilnetv3中se模块通过自适应地调整通道的权重来增强重要特征,split-attent...

【专利技术属性】
技术研发人员:沈瑜李博昊高宝渠李阳阳白珊魏子易
申请(专利权)人:兰州交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1