【技术实现步骤摘要】
基于多层时空融合的轻量化驾驶人注意力预测方法和装置
[0001]本专利技术涉及智能交通
,具体涉及一种基于多层时空融合的轻量化驾驶人注意力预测方法和装置。
技术介绍
[0002]类人驾驶是提升汽车智能化程度的重要途径之一,其中识别和定位驾驶人的感兴趣目标和区域的驾驶人注意力预测技术,能够快速、精确地感知驾驶场景中潜在风险或提供决策所需关键信息,可有效增强智能汽车的功能可理解性和鲁棒性。驾驶人注意力的分布情况会影响车辆行驶安全性和稳定性,例如分心驾驶行为引发交通事故的几率远高于专注驾驶状态,但熟练的驾驶人可以快速识别交通场景中的各类要素及其运动状态,从而及时辨识直接或潜在的驾驶风险信息。因此,通过学习熟练驾驶人专注驾驶时的视觉特性,挖掘多种交通场景中驾驶人注意力的变化规律,实时检测和识别场景中重要目标和区域,增强驾驶辅助系统能效、提高智能化类人驾驶系统水平,从而提高驾驶安全性。
[0003]驾驶场景具有高度的时空特性,因此当前的驾驶人注意力预测方法聚焦于如何利用场景中的时空信息。例如使用光流法、语义图像等旁路网络,但这些额外的分支加剧了网络的计算量;使用LSTM在帧间传递时间信息的方法无法很好的捕捉到连续帧间更深层的耦合时空特征;使用3D卷积能够提取场景中更深层的时空耦合特征,但全3D卷积网络具有庞大的内存开销和更高的优化难度。
[0004]可以看出,提供一种兼顾预测速度和精度的驾驶人注意力预测方法是非常有必要的。
技术实现思路
[0005]为解决上述技术问题,本专利技术提供一种基 ...
【技术保护点】
【技术特征摘要】
1.基于多层时空融合的轻量化驾驶人注意力预测方法,其特征在于,包括:获取视频帧提取并存储所述视频帧中连续帧间的多层级空间特征;通过在时间维度融合所述多层级空间特征来生成驾驶人的注意力显著图;基于所述驾驶人的注意力显著图来输出驾驶人注意力预测结果。2.根据权利要求1所述的基于多层时空融合的轻量化驾驶人注意力预测方法,其特征在于,在所述获取视频帧之后,还包括:对所述视频帧将的图像进行尺寸调整处理及标准化处理;所述尺寸调整处理为将所述视频帧的RGB图像的尺寸缩放至宽高为256
×
256;所述标准化处理为利用Z
‑
Score标准化对经过尺寸调整处理后的所述RGB图像分别在R、G、B三个颜色通道上进行标准化处理,以生成符合标准正态分布的标准化图像数据,如公式(1)所示:其中,x
i
为对应颜色通道上的输入;为对应颜色通道标准化后的输出;
μi
为数据集训练集上对应颜色通道的图像亮度值均值,分别为{0.471,0.448,0.408};σ
i
为对应的图像亮度值标准差的平均值,分别为{0.234,0.239,0.242}。3.根据权利要求2所述的基于多层时空融合的轻量化驾驶人注意力预测方法,其特征在于,还包括:建立多层时空融合网络模型,并利用该模型对所述标准化图像数据进行注意力预测;所述多层时空融合网络模型包括编码器和解码器两个模块,所述编码器模块用于提取并存储所述视频帧中连续帧间的多层级空间特征,所述解码器模块用于通过在时间维度融合所述编码器模块输出的多层级空间特征来生成驾驶人的注意力显著图。4.根据权利要求3所述的基于多层时空融合的轻量化驾驶人注意力预测方法,其特征在于,在所述建立多层时空融合网络模型之后,还包括:对所述多层时空融合网络模型进行训练;对所述多层时空融合网络模型进行训练包括利用KL散度作为监督层上的损失函数l
KL
(G,S)对网络进行优化;所述KL散度的计算公式如式(2)所示:其中,G∈[0,1]为驾驶人注意力的真实标签,S∈[0,1]为模型预测出的显著性值,i为每一点的像素值;当网络经过迭代优化至损失值l
KL
(G,S)收敛时,训练结束并保存当前的网络参数,然后使用所述网络和网络参数进行驾驶人的注意力预测。5.根据权利要求3所述的基于多层时空融合的轻量化驾驶人注意力预测方法,其特征
在于,所述编码器模块包括特征提取骨干和记忆模块;其中,所述特征提取骨干用于使用轻量化网络MobileNetV2的全卷积层,并且提取当前输入帧从Level
‑
1到Level
‑
4四个层级上的特征作为骨干网络的输出;所述记忆模块用于在时间维度上拼接聚合当前帧I
t
编码后的特征和存储的历史帧V
t
={I
t
‑
T+1
,
…
,I
t
‑1}中的特征得到时间长度为T的特征张量后传输给所述解码器模块;以及,在当前帧I
t
时刻模型执行完毕后,所述记忆模块去除I
t
‑
T+1...
【专利技术属性】
技术研发人员:郭柏苍,纪丙东,金立生,姚航,许新亮,王胤霖,雒国凤,
申请(专利权)人:燕山大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。