一种基于车载感知设备的车辆行为分析方法与装置制造方法及图纸

技术编号：30700412 阅读：39 留言：0更新日期：2021-11-06 09:36

本发明专利技术公开了一种基于车载感知设备的车辆行为分析方法，通过联合训练方法设计车辆行为分析算法，将算法嵌入到车载感知设备中，从而实现车辆行为分析。联合训练的行为分析算法设计为通过联邦学习在多场景下进行端到端的深度强化学习训练，学习自动驾驶策略，可使驾驶评估结果更为综合全面，避免构建模型时需要大量数据迭代的问题以及驾驶信息的泄露；本方法提出了基于安全度、舒适性和经济开销的多维度行为分析算法，通过该分析算法可以对车辆的行为进行分析，实现驾驶行为评估与安全预警。实现驾驶行为评估与安全预警。实现驾驶行为评估与安全预警。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于车载感知设备的车辆行为分析方法与装置

[0001]本专利技术涉及深度学习和车辆安全领域，具体涉及一种基于车载感知设备的车辆行为分析方法与装置。

技术介绍

[0002]随着交通网络的日益拓展和汽车产品的普及，城市道路交通安全问题也愈加突出。同时，近年来车联网技术的飞速发展为驾驶行为评估的研究领域提供了新的机遇和解决方案。车联网技术的目的是建立一个包含道路上车辆、基础设施和行人等要素的网络，因此需要对司机的驾驶行为进行识别，从而对驾驶好坏进行评估，提高交通安全性。
[0003]驾驶行为的识别一般分为两种模式，一种是人工分析判别，另一种是驾驶行为的智能分析。现有的驾驶行为识别评估方法主要是基于大量驾驶数据建立驾驶行为模型，将实时驾驶信息输入到模型中进行分析以获得分析结果。而这需要收集大量驾驶行为、驾驶环境数据作分析，以实现对驾驶行为及环境的感知，目前驾驶行为分析的数据来源主要分为以下三种：
[0004]一是在车载摄像头采集的视频流中捕获图像，并对图像进行变换预处理，从而获取必要的道路状况、驾驶行为车速以及加速度等数据信息。二是通过传感器测量车辆的三轴加速度、速度、转向曲径等用于分析司机驾驶方式。三是基于CAN总线获取车辆速度、转向幅度、加速度、油耗、刹车力度、GPS定位等车辆运行信息数据。然而，此类方法只考虑相关速度变化率等因素，通过车辆内部信息分析，缺少当前环境、交通安全及行人等因素，评估考虑不全面，应用高价值低。
[0005]目前对行车进行分析的主要方案为收集到相关的驾驶行为数据后，使用

【技术保护点】

【技术特征摘要】
1.一种基于车载感知设备的车辆行为分析方法，其特征在于，包括：步骤1，对驾驶策略模型进行初始化；所述驾驶策略模型为建立在不同客户端中的神经网络模型，并对各客户端进行分组编号；步骤2，各客户端在各自的驾驶环境中通过强化学习算法进行驾驶策略模型的训练，每训练设定的轮次后，将模型的参数更新返回服务器；客户端更新迭代的方式如下：其中，k为客户端编号、η为学习率、w
k
为第k个驾驶策略模型的权重参数，是第k个驾驶策略模型的参数梯度；步骤3，服务器对所有客户端返回的模型参数进行加权平均，得到聚合后的参数：其中，n为参数总数，n
k
为第k个客户端的参数总数，K为客户端的数量；步骤4，将聚合后的参数下发给各个客户端，循环步骤2
‑
3，直至训练结束，获得联合训练驾驶策略模型；步骤5，将联合训练的驾驶策略模型，作为行为分析基准；基于该基准，从车辆中获取驾驶数据，并对数据进行分析处理，将车辆当前的数据与设定的基准数据从安全度、舒适度、经济开销三个维度全面分析车辆的行为，得到车辆行为分析打分，从而分析评估车辆行为；其中：安全度评估公式如下：其中，s
s
为安全度评估分数，L
P
为车辆到路边基线的距离，L
R
为路面的宽度，θ
b
为驾驶基准车辆的前向速度与道路中轴线的夹角，θ为被评估车辆的前向速度与道路中轴线的夹角，V
bx
为评估车辆的前向行驶速度，V
max
为车辆最高限速，V
x
表示驾驶基准车辆的前向行驶速度，为评分权重；车辆舒适度评估公式如下：Z＝|V
bz
‑
V
z
|其中，V
bz
为驾驶基准车辆垂直地面方向的行驶速度，V
z
被评估车辆垂直地面方向的行驶速度，S
C
为舒适度评估分，e为自然对数底数，A
acct
为被评估车辆的当前加速度，A
bacct
为驾驶基准车辆的当前加速度，A
max
为车辆最大加速度，k为比例系数；燃油经济评估公式如下：Y＝|V
by
‑
V
y
|
其中，S
P
为经济开销评估分，V
by
为驾驶基准车辆横向行驶速度，V
y
为被评估车辆横向行驶速度，ξ为比例系数，用来表示各部分占的评估分数比值；则最终被评估车辆行为分析打分S如下：S＝100*(αS
s
+βS
c
+(1
‑
α
‑
β)S
p
)其中，α、β为设定的比例系数。2.根据权利要求1所述的基于车载感知设备的车辆行为分析方法，其特征在于，所述通过强化学习算法进行驾驶策略模型的训练的过程如下：2.1通过预设的权重初始化当前策略网络与目标策略网络、当前评论网络与目标评论网络以及经验回放池；其中，经验回放池初始化置空；2.2根据当前策略网络选择动作选择动作的是策略网络，根据当前环境状态产生动作：a
t
＝μ(s
t
|θ
μ
+N
t
)其中，a
t
为输出动作、μ为权重、s
t
为环境状态、N
t
为噪声；2.3保存经验到回放池。将当前训练的(s
t
，a
t
，r
t
，s
t+1
)保存到经验回放池R，供后续的随机采样；其中，s
t
为当前状态、a
t
为动作、r

【专利技术属性】
技术研发人员：李贺，余荣，谭北海，韩晓岚，黄泽茵，李培春，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人