一种基于深度学习的收费站各车道通行状态检测的方法技术

技术编号:38647525 阅读:15 留言:0更新日期:2023-09-02 22:38
本发明专利技术公开了一种基于深度学习的收费站各车道通行状态检测的方法。首先构建收费站LED灯上文字相关的数据集,同时构建车道通行状态数据库;然后构建结合卷积注意力模块和密集连接模块的卷积神经网络分类模型,通过使用收费站LED灯上文字数据集和卷积神经网络分类模型,训练得到收费站LED灯上文字识别的模型;将待检测数据传入检测模型,可以得到该图中LED灯上的文字;根据得到的LED灯上的文字信息,可以得到该车道的通行状态。本发明专利技术的优点在于将传统的文字识别任务转化为已知类别的分类任务,大大降低了开销,进而完成对收费站车道通行状态的判断。车道通行状态的判断。车道通行状态的判断。

【技术实现步骤摘要】
一种基于深度学习的收费站各车道通行状态检测的方法


[0001]本专利技术涉及图像识别与机器视觉
,具体涉及一种基于深度学习的收费站各车道通行状态检测的方法。

技术介绍

[0002]随着中国高速公路的逐年扩建,高速公路上的车辆也日益增多。而作为高速公路的出入口,收费站在高速公路体系中有着举足轻重的地位,高速收费站处的秩序问题一直困扰着司乘们。
[0003]目前针对收费站车道通行状态这一任务,普遍使用文字识别技术。对文字识别的方法主要使用不同程度的OCR技术,该技术虽然识别效果好,但大多用于文本识别,而且要融合目标检测、目标分类、方向分类器等多项技术,落地成本较高。为此,我们提出一种基于深度学习的收费站各车道通行状态检测的方法。

技术实现思路

[0004]本专利技术的目的在于提供一种基于深度学习的收费站各车道通行状态检测的方法,以解决上述
技术介绍
中提出的问题。
[0005]为了解决上述技术问题,本专利技术提供如下技术方案:一种基于深度学习的收费站各车道通行状态检测的方法,包括:
[0006]S1:构建数据集D1,并按时间顺序分组,同时,构建车道通行状态数据库D2;
[0007]S2:将D1中的图片序列进行统一处理后,输入至两层卷积模块进行下采样,获取对应的图像特征;
[0008]S3:将S2中提取到的特征输入到CBAM模块,即卷积注意力模块(Convolutional Block Attention Module),得到空间注意力特征和通道注意力特征的加权特征图,响应梯度变化较大的部分,加强特征提取;
[0009]S4:将S3中得到的加权特征图输入到两个连续的密集连接模块中,此操作方便每组图片内的不同图片间的梯度互相融合,便于模糊图片的特征学习;
[0010]S5:将S4中得到的密集连接学到到的特征图进行最大池化、全连接操作之后,将其结果输入softmax进行分类,对D1中每组收费站LED灯上文字图片使用AlexNet进行训练,得到分类模型;
[0011]S6:将待测图片输入到分类模型中,可以得到LED灯上的文字;
[0012]S7:根据S6得到的LED灯上文字及车道通行状态数据库D2判断该车道的通行状态。
[0013]本专利技术进一步说明,所述CBAM模块为一种用于前馈卷积神经网络的注意力模块,其集成了通道注意力机制和空间注意力机制,使特征会沿着两个独立的维度依次判断特征图,进而得到两个维度上的特征权重。
[0014]本专利技术进一步说明,所述通道注意力机制可以表达为公式(1):
[0015][0016]其中:F表示输入特征图,M
c
∈R
C
×1×1表示通道注意力,σ表示sigmoid函数,MLP表示多层感知机,AvgPool表示全局平均池化,MaxPool表示最大池化,W0∈R
C/r
×
C
,W1∈R
C
×
C/r
表示MLP的共享权重,C是通道数,r为自定义比率。
[0017]本专利技术进一步说明,所述空间注意力机制可以表达为公式(2):
[0018][0019]其中:M
s
∈R
H
×
W
表示空间注意力,f7×7表示卷积核的尺寸为7
×
7,
[0020][0021]本专利技术进一步说明,所述CBAM模块可以表达为公式(3):
[0022][0023]其中:F∈R
C
×
H
×
W
,表示输入的特征图,表示元素间的点对点的乘运算,F

表示经过通道注意力后的输出,M
s
∈R1×
H
×
W
表示空间注意力,F

表示经过通道注意力和空间注意力后的输出。
[0024]本专利技术进一步说明,还包括密集连接模块的使用,密集连接是指任何层到所有后续层的直接连接,可以表达为公式(4):
[0025]M
l
=H
l
([M0,M1,...,M
l
‑1])
ꢀꢀꢀ
(4)
[0026]其中:M
l
表示接收到前面所有层M0,M1,...,M
l
‑1的特征图的拼接,H表示拼接操作。
[0027]与现有技术相比,本专利技术所达到的有益效果是:本专利技术,
[0028](1)本专利技术将传统的文字识别任务转化为已知类别的分类任务,大大降低了开销,进而完成对收费站车道通行状态的判断,可以在一定程度上提高数据共享和路网协调机制,加强交通疏导,有效解决收费站出入口交通拥堵的问题,确保人民群众出行平安畅通,提高收费站出入口车辆通行能力,更好的维护收费站广场的秩序,进而更好的服务于司乘人员。
附图说明
[0029]附图用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与本专利技术的实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中:
[0030]图1是本专利技术一种基于深度学习的收费站各车道通行状态检测的方法的流程图;
[0031]图2是本专利技术一种基于深度学习的收费站各车道通行状态检测的方法的CBAM模块示意图;
[0032]图3是本专利技术一种基于深度学习的收费站各车道通行状态检测的方法的通道注意力模块示意图;
[0033]图4是本专利技术一种基于深度学习的收费站各车道通行状态检测的方法的空间注意
力模块示意图;
[0034]图5是本专利技术一种基于深度学习的收费站各车道通行状态检测的方法的密集连接模块示意图;
[0035]图6是本专利技术一种基于深度学习的收费站各车道通行状态检测的方法的训练过程示意图。
具体实施方式
[0036]以下结合较佳实施例及其附图对本专利技术技术方案作进一步非限制性的详细说明。显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0037]请参阅图1

图6,一种基于深度学习的收费站各车道通行状态检测的方法,具体步骤如下
[0038]S1:构建数据集D1。该数据集收集了近50个收费站、覆含全天不同时间段的LED灯上的字符图,作为样本进行标注,并将同一时段的字符图标为一组。标注方式按分类任务的方式进行。根据需求,自制数据集D1,其中训练集和验证集按8:2划分。数据集D1的总量为48k,其中训练集T的数量为37.6k,验证集V的数量为9.4k,并按照时间顺序进行分组。同时,构建车道通行状态数据库D2。如:“人工车道”属于车道打开状态,“车维修”属于车道关闭状态。
[0039]S2:将D1中的图片序列进行统一处理后,输入至2层卷积模块进行下采样,获取对应的图像特征本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习的收费站各车道通行状态检测的方法,其特征在于:包括:S1:构建数据集D1,并按时间顺序分组,同时,构建车道通行状态数据库D2;S2:将D1中的图片序列进行统一处理后,输入至两层卷积模块进行下采样,获取对应的图像特征;S3:将S2中提取到的特征输入到CBAM模块,即卷积注意力模块(Convolutional Block Attention Module),得到空间注意力特征和通道注意力特征的加权特征图,响应梯度变化较大的部分,加强特征提取;S4:将S3中得到的加权特征图输入到两个连续的密集连接模块中,此操作方便每组图片内的不同图片间的梯度互相融合,便于模糊图片的特征学习;S5:将S4中得到的密集连接学到到的特征图进行最大池化、全连接操作之后,将其结果输入softmax进行分类,对D1中每组收费站LED灯上文字图片使用AlexNet进行训练,得到分类模型;S6:将待测图片输入到分类模型中,可以得到LED灯上的文字;S7:根据S6得到的LED灯上文字及车道通行状态数据库D2判断该车道的通行状态。2.根据权利要求1所述的一种基于深度学习的收费站各车道通行状态检测的方法,其特征在于:所述CBAM模块为一种用于前馈卷积神经网络的注意力模块,其集成了通道注意力机制和空间注意力机制,使特征会沿着两个独立的维度依次判断特征图,进而得到两个维度上的特征权重。3.根据权利要求2所述的一种基于深度学习的收费站各车道通行状态检测的方法,其特征在于:所述通道注意力机制可以表达为公式(1):其中:F表示输入特征图,M
c
∈R
C
×1×1表示通道注意力,σ表示sigmoid函数,MLP表示多层感知机,AvgPool表示全局平均池化,Ma...

【专利技术属性】
技术研发人员:申元颜世航
申请(专利权)人:杭州像素元科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1