基于注意力机制和特征加权融合的车辆检测方法及装置制造方法及图纸

技术编号:31741324 阅读:29 留言:0更新日期:2022-01-05 16:19
本发明专利技术公开了一种基于注意力机制和特征加权融合的车辆检测方法及装置,该方法包括:对待检测图像进行预处理;将预处理后的待检测图像输入预先训练好的车辆检测模型中;利用车辆检测模型,基于预处理后的待检测图像,采用通道和空间双维度注意力机制,生成通道注意力特征图和空间注意力特征图;通过加权双向特征融合网络,基于通道注意力特征图和空间注意力特征图,进行有区分地特征融合,得到融合特征;基于融合特征,得到包含车辆位置和大小信息的检测结果。本发明专利技术相较于现有的车辆检测技术,在保持较快检测速度的同时,减少了参数量并提高了检测精度,尤其对小尺度车辆的检测效果显著。著。著。

【技术实现步骤摘要】
基于注意力机制和特征加权融合的车辆检测方法及装置


[0001]本专利技术涉及车辆目标检测
,特别涉及一种基于注意力机制和特征加权融合的车辆检测方法及装置。

技术介绍

[0002]车辆检测,是指在给定图像或视频序列中,基于车辆目标几何和统计特征,进行图像实例和场景分割,确定车辆在图像中的大小和位置信息,并以检测框的形式输出。
[0003]车辆检测方法主要分为基于手工特征的传统算法和基于深度神经网络的检测方法。在传统算法中,依靠人工设计特征来进行特征提取,人工设计特征的优劣直接决定了目标检测的精度,对于环境复杂多变、视频分辨率较低的公路监控场景而言,容易出现漏检、错检等错误。此外,还伴随着可移植性差、计算冗余度高等局限。
[0004]基于深度学习的方法不需要人工提取特征,通过非线性模型把原始输入数据转化为更深层次、更抽象的特征,挖掘更高层视觉信息,具有极强的学习表征能力,因此逐渐成为车辆目标检测中的主流方法。公路监控视频场景下的车辆检测存在着场景复杂多样,干扰严重、目标尺寸小、尺寸变化大等问题。现有的基于深度神经网络的车辆目标检测方法对远距离及小目标车辆效果欠佳,泛化能力偏弱。常见的车辆检测方法受到场景变化的影响较大,对公路场景适用性不强,且难以在检测速度、模型大小与检测精度之间达到平衡,如高速区域卷积神经网络(Faster Region Convolutional Neural Network,Faster R

CNN),通过图像分割生成候选区域,再对其进行分类回归操作,实现精确的检测和分类,但检测速度慢;YOLO系列算法直接对目标类别位置进行回归,检测速度快,但一定程度上牺牲了检测精度,且图像特征提取不充分,在网络卷积过程中,随着卷积的深入,大目标的特征容易被保留,小目标的特征越往后越容易被忽略,导致对小目标检测效果差。另外神经网络参数过多,使得训练时间变长,模型参数量大,可移植性差。

技术实现思路

[0005]本专利技术提供了一种基于注意力机制和特征加权融合的车辆检测方法及装置,以解决现有车辆检测技术所存在的精度不够高及模型参数量大的技术问题。
[0006]为解决上述技术问题,本专利技术提供了如下技术方案:
[0007]一方面,本专利技术提供了一种基于注意力机制和特征加权融合的车辆检测方法,该基于注意力机制和特征加权融合的车辆检测方法包括:
[0008]对待检测图像进行预处理,得到预处理后的待检测图像;
[0009]将预处理后的待检测图像输入预先训练好的车辆检测模型中;
[0010]利用所述车辆检测模型,基于预处理后的待检测图像,采用通道和空间双维度注意力机制,生成通道注意力特征图和空间注意力特征图;
[0011]通过加权双向特征融合网络,基于所述通道注意力特征图和所述空间注意力特征图,进行有区分地特征融合,得到融合特征;
[0012]基于所述融合特征,得到包含车辆位置和大小信息的检测结果。
[0013]进一步地,预处理为对待检测图像进行归一化处理,以统一图像规格尺寸。
[0014]进一步地,所述车辆检测模型包括:特征提取层、特征融合层、卷积块注意力机制模块、空间金字塔池化层、卷积层、目标检测层以及激活函数;其中,所述特征提取层包含切片操作;所述目标检测层包含三个不同大小尺度;所述卷积块注意力模块包括通道维度注意力模块和空间维度注意力模块。
[0015]进一步地,利用所述车辆检测模型,基于预处理后的待检测图像,采用通道和空间双维度注意力机制生成通道注意力特征图和空间注意力特征图,包括:
[0016]通过所述特征提取层对输入的待检测图像进行切片操作,得到四个尺度大小为原来一半的特征图分支,对所述特征图分支进行拼接,得到第一特征图;
[0017]通过所述卷积层对所述第一特征图进行卷积操作,得到第二特征图;
[0018]通过所述通道维度注意力模块,将所述第二特征图分别经过全局最大池化层和全局平均池化层,得到第三特征图和第四特征图,然后分别将所述第三特征图和所述第四特征图输入到多层感知机中,将所述多层感知机输出特征进行基于element

wise的加和操作,再经过激活函数激活,生成通道注意力特征图;
[0019]通过所述空间维度注意力模块,将所述通道注意力特征图经过基于通道的全局最大池化和全局平均池化,得到第五特征图和第六特征图,将所述第五特征图和所述第六特征图基于通道数进行concat拼接操作,然后经过一个7
×
7的卷积进行通道降维,最后经过激活函数激活,生成空间注意力特征图。
[0020]进一步地,所述通过加权双向特征融合网络,基于所述通道注意力特征图和所述空间注意力特征图,进行有区分地特征融合,得到融合特征,包括:
[0021]将所述通道注意力特征图与所述第二特征图做element

wise乘法操作,得到第七特征图;
[0022]将所述空间注意力特征图与所述通道注意力特征图做element

wise乘法操作,得到第八特征图;
[0023]在所述特征融合层采用加权双向特征融合网络,来学习不同输入特征的权重,对所述第七特征图和第八特征图进行有区分地特征融合,得到融合特征。
[0024]进一步地,所述特征融合层采用BIFPN结构。
[0025]进一步地,基于融合特征得到包含车辆位置和大小信息的检测结果,包括:
[0026]基于所述融合特征,通过所述目标检测层中三个不同尺度大小的检测层对不同大小的目标进行检测,得到包含车辆位置和大小信息的检测结果。
[0027]进一步地,目标检测层包含160
×
160、80
×
80、40
×
40三个尺度的检测层。
[0028]进一步地,所述卷积层首先通过有限的普通卷积得到第一组特征图,再将所述第一组特征图通过线性操作生成第二组特征图,最后将所述第一组特征图和所述第二组特征图在指定维度进行拼接,作为最终的卷积结果;其中,
[0029]所述普通卷积运算定义为:
[0030]Y=X
·
ω+b
[0031]式中,Y表示所述普通卷积运算结果,X∈R
c
×
h
×
w
,代表所述普通卷积运算输入,c、h、w分别代表输入通道数、特征图高度和宽度,ω∈R
c
×
k
×
k
×
n
代表进行卷积运算的是c
×
n个大
小为k
×
k的卷积核,b为偏差项;
[0032]所述线性操作运算定义为:
[0033]Y

=X
·
ω

[0034]Y
ij
=Φ
i,j
,i∈[1,m],j∈[1,s][0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于注意力机制和特征加权融合的车辆检测方法,其特征在于,所述基于注意力机制和特征加权融合的车辆检测方法包括:对待检测图像进行预处理,得到预处理后的待检测图像;将预处理后的待检测图像输入预先训练好的车辆检测模型中;利用所述车辆检测模型,基于预处理后的待检测图像,采用通道和空间双维度注意力机制,生成通道注意力特征图和空间注意力特征图;通过加权双向特征融合网络,基于所述通道注意力特征图和所述空间注意力特征图,进行有区分地特征融合,得到融合特征;基于所述融合特征,得到包含车辆位置和大小信息的检测结果。2.如权利要求1所述的基于注意力机制和特征加权融合的车辆检测方法,其特征在于,所述预处理为对待检测图像进行归一化处理,以统一图像规格尺寸。3.如权利要求1所述的基于注意力机制和特征加权融合的车辆检测方法,其特征在于,所述车辆检测模型包括:特征提取层、特征融合层、卷积块注意力机制模块、空间金字塔池化层、卷积层、目标检测层以及激活函数;其中,所述特征提取层包含切片操作;所述目标检测层包含三个不同大小尺度;所述卷积块注意力模块包括通道维度注意力模块和空间维度注意力模块。4.如权利要求3所述的基于注意力机制和特征加权融合的车辆检测方法,其特征在于,利用所述车辆检测模型,基于预处理后的待检测图像,采用通道和空间双维度注意力机制,生成通道注意力特征图和空间注意力特征图,包括:通过所述特征提取层对输入的待检测图像进行切片操作,得到四个尺度大小为原来一半的特征图分支,对所述特征图分支进行拼接,得到第一特征图;通过所述卷积层对所述第一特征图进行卷积操作,得到第二特征图;通过所述通道维度注意力模块,将所述第二特征图分别经过全局最大池化层和全局平均池化层,得到第三特征图和第四特征图,然后分别将所述第三特征图和所述第四特征图输入到多层感知机中,将所述多层感知机输出特征进行基于element

wise的加和操作,再经过激活函数激活,生成通道注意力特征图;通过所述空间维度注意力模块,将所述通道注意力特征图经过基于通道的全局最大池化和全局平均池化,得到第五特征图和第六特征图,将所述第五特征图和所述第六特征图基于通道数进行concat拼接操作,然后经过一个7
×
7的卷积进行通道降维,最后经过激活函数激活,生成空间注意力特征图。5.如权利要求4所述的基于注意力机制和特征加权融合的车辆检测方法,其特征在于,所述通过加权双向特征融合网络,基于所述通道注意力特征图和所述空间注意力特征图,进行有区分地特征融合,得到融合特征,包括:将所述通道注意力特征图与所述第二特征图做element

wise乘法操作,得到第七特征图;将所述空间注意力特征图与所述通道注意力特征图做element

wise乘法操作,得到第八特征图;在所述特征融合层采用加权双向特征融合网络,来学习不同输入特征的权重,对所述第七特征图和第八特征图进行有区分地特征融合,得到融合特征。
6.如权利要求5所述的基于注意力机制和特征加权融合的车辆检测方法,其特征在于,所述特征融合层采用BIFPN结构。7.如权利要求3所述的基于注意力机制和特征加...

【专利技术属性】
技术研发人员:刘丽梁鹏雷雪梅邵立珍
申请(专利权)人:北京科技大学顺德研究生院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1