一种驾驶行为无监督模式识别方法及数据采集监控系统技术方案

技术编号:29403804 阅读:76 留言:0更新日期:2021-07-23 22:42
本发明专利技术公开了一种驾驶行为无监督模式识别方法及数据采集监控系统,所述方法包括:采集驾驶员在驾驶过程中的驾驶数据片段并进行特征提取;利用改进的基于Wasserstein距离的自适应K‑Means聚类算法对提取的特征进行聚类,获得驾驶行为模式;建立驾驶行为主题描述,利用LDA模型将驾驶行为主题描述与所有聚类获得的驾驶行为模式进行匹配,得到无监督驾驶行为的识别结果。此外,本发明专利技术还构建了相应的数据采集监控系统,由模式识别算法、硬件架构、监控APP组成了一个完整的驾驶行为无监督模式监控系统,能够更加有效地识别驾驶行为,实现对驾驶行为的实时监控,提高驾驶员的行车安全性。

【技术实现步骤摘要】
一种驾驶行为无监督模式识别方法及数据采集监控系统
本专利技术涉及驾驶行为无监督模式识别及预测监控
,特别涉及一种驾驶行为无监督模式识别方法及数据采集监控系统。
技术介绍
近年来,我国的机动车行业发展迅速。2020年,国内汽车保有量已经达到2.7亿辆,驾驶人员达4.1亿,机动车、驾驶人总量及增量均居世界第一。然而,伴随汽车保有量的提高,交通管理工作存在的深层次矛盾逐渐显现出来。我国是世界上道路交通事故最多的国家之一。根据国家统计局公布的数据,我国每万车的死亡率已经达到了惊人的6.2,这一数据已经达到了发达国家的4到8倍,由此看来,我国对不良驾驶行为的监管任务任重道远。因此,无论是运输企业还是政府相关部门,都应该对道路交通安全问题给予高度重视。大量事故案例的分析表明,虽然导致交通事故的成因多种多样,但人为原因始终是事故发生的主要因素。驾驶员的异常驾驶行为往往会成为重大交通事故的诱因。因此,如果能够有效识别异常驾驶行为,并及时对驾驶员发出警报,就能够在一定程度上避免道路交通事故。另一方面,有效识别异常驾驶行为也能够帮助交通部门与运营企业实现安全形势的动态监管和评价,提升安全管理水平。为了节约成本,使用车辆GPS、速度、加速度等信息进行监控和预警成为当前研究的热点。通过分析国内外相关资料可知,异常驾驶行为的识别方法已经有效运用于驾驶员行为管理等一系列的安全监管领域,提高了监管水平,降低了事故发生概率。因此,为了有效提高交通行业的安全监管,对车辆监控数据进行深层次的分析与应用势在必行。尽管如此,当前的异常驾驶行为模式识别算法还处于一个比较初级的阶段,仍存在如下问题:(1)研究的目标仍是在交通运行水平上检测孤立事件,忽略了其他导致交通模式改变的因素;(2)目前异常驾驶行为识别多采用有监督算法,然而标记数据昂贵且稀少,导致相关信息的丢失和泛化性能的降低。因此,探究无监督的异常驾驶行为识别算法势在必行。
技术实现思路
本专利技术的目的在于提供一种驾驶行为无监督模式识别方法及数据采集监控系统,采用自下而上的无监督方法对异常驾驶行为进行检测与识别,向驾驶员提供及时的反馈,进而提高驾驶员的行车安全性。为解决上述技术问题,本专利技术的实施例提供如下方案:一方面,提供了一种驾驶行为无监督模式识别方法,包括以下步骤:S1、采集驾驶员在驾驶过程中的驾驶数据片段并进行特征提取;S2、利用改进的基于Wasserstein距离的自适应K-Means聚类算法对提取的特征进行聚类,获得驾驶行为模式;S3、建立驾驶行为主题描述,利用LDA模型将驾驶行为主题描述与所有聚类获得的驾驶行为模式进行匹配,得到无监督驾驶行为的识别结果。优选地,在所述步骤S1中,所述驾驶数据片段包括轨迹曲率、加速度、速度、转向角度四个变量;提取的特征分为两类:统计特征和时间特征;所述统计特征包括:平均值、方差、ACF1、余数自相关、趋势、曲率和熵;所述时间特征包括:最大平均值差值、最大方差差值、Kullback-Leibler散度的最大位移和余数方差。优选地,所述步骤S2具体包括:S200、输入特征样本数据集Q={xs|s=1,...,N};S201、令k为自1至kmax的循环,计算聚类数目为k时的聚类簇,其中kmax为最大聚类数目;S202、在特征样本数据集Q中随机选择k个样本点,分别赋给初始聚类中心μ1,μ2,...,μb,...,μk;S203、令s为1-N的循环,其中N代表待聚类样本的个数,计算样本xb与各个聚类中心μb的距离d(xs,μb);S204、找出xs关于聚类中心μb的最小距离,将xs归入到关于μb距离最小的簇Cb中;S205、更新各个类簇的聚类中心,如果新的聚类中心与原聚类中心不相等,则更新聚类中心;S206、重复步骤S203-步骤S205,直至聚类中心不再更新为止;S207、计算当前聚类误差平方和SSEk;S208、计算当前聚类误差平方和与上一个聚类误差平方和的差值,即下降幅度ΔSSEk=SSEk-1-SSEk;S209、计算下降幅度变化差值,即ΔΔSSEk=ΔSSEk-1-ΔSSEk;S210、重复步骤S201-步骤S209,直至k=kmax;S211、最优聚类个数为ΔΔSSEk最大的时候k的取值,此时聚类结果即为最优聚类结果;S212、输出聚类结果。优选地,Wasserstein距离定义如下:假设θ和ι代表了两个分布,它们之间的距离通过以下公式计算:其中Π(θ,ι)是θ和ι分布组合起来的所有可能的联合分布的集合,π代表θ和ι所表示的其中一个联合分布,E(m,n)~Π[||m-n||]计算了在当前联合分布π的条件下两个分布的距离期望值;对所有的联合分布进行计算后,利用取得所有期望的下界,即为Wasserstein距离数值;令子序列集描述为X=(x1,...,xs,...,xN),其中N为数据集样本总数,l为子序列特征的维度,k是聚类数目,聚类中心向量为{μ1,μ2,...,μb,...,μk};样本xs与聚类中心μb的距离为:Π(xs,μb)是xs和μb分布组合起来的所有可能的联合分布的集合,Π代表xs和μb所表示的其中一个联合分布;其中xsf,μbf分别代表了xs与μb的第f个特征。优选地,引入手肘法计算目标函数以获得最佳聚类个数:当SSE数值达到最小时获得最佳聚类个数。优选地,所述步骤S3中,建立驾驶行为主题描述是指通过提取驾驶特征对驾驶行为进行语义表达;其中,所述驾驶行为主题包括5种正常驾驶行为主题和6种异常驾驶行为主题;5种正常驾驶行为主题包括:匀速直线行驶、温和起步、曲线平稳行驶、正常变道、温和停止;6种异常驾驶行为主题包括:快速变道、急刹车、急速超车、曲线快速行驶、急加速、曲线超车。优选地,所述步骤S3中,基于LDA模型的无监督驾驶行为识别过程如下:LDA模型实质是一个三层贝叶斯网络,通过计算特征生成概率进行无监督的驾驶行为匹配;设定Ω={Ω1,...,Ωd,...,Ωk}代表驾驶行为模式,其中驾驶行为模式的数量为提取的聚类个数k,O是驾驶行为主题的数量;驾驶行为模式Ω中观察到的局部驾驶行为特征参数表示为其中Ud是局部特征的数目,这里采用8个特征,分别为轨迹曲率均值、轨迹曲率方差、速度均值、速度方差、加速度均值、加速度方差、转向角均值、转向角方差;LDA假设在第d个驾驶行为模式中观察到的第u个特征wd,u是根据潜在驾驶行为zd,u生成的,即假设特征wd,u的实际值w是根据生成的,则LDA的分配由θo|d和Dirichlet参数α得出,其中φo是具有Dirichlet参数β的具有潜在驱动主题的特征分布;因此,LDA的生成模型假定为:θd~Dir(θ;α)φo~Dir(φ;β)zd,u~Mult(z;θd)当观察到特征w={wd,u}时,该特征的生成本文档来自技高网
...

【技术保护点】
1.一种驾驶行为无监督模式识别方法,其特征在于,包括以下步骤:/nS1、采集驾驶员在驾驶过程中的驾驶数据片段并进行特征提取;/nS2、利用改进的基于Wasserstein距离的自适应K-Means聚类算法对提取的特征进行聚类,获得驾驶行为模式;/nS3、建立驾驶行为主题描述,利用LDA模型将驾驶行为主题描述与所有聚类获得的驾驶行为模式进行匹配,得到无监督驾驶行为的识别结果。/n

【技术特征摘要】
1.一种驾驶行为无监督模式识别方法,其特征在于,包括以下步骤:
S1、采集驾驶员在驾驶过程中的驾驶数据片段并进行特征提取;
S2、利用改进的基于Wasserstein距离的自适应K-Means聚类算法对提取的特征进行聚类,获得驾驶行为模式;
S3、建立驾驶行为主题描述,利用LDA模型将驾驶行为主题描述与所有聚类获得的驾驶行为模式进行匹配,得到无监督驾驶行为的识别结果。


2.根据权利要求1所述的驾驶行为无监督模式识别方法,其特征在于,在所述步骤S1中,所述驾驶数据片段包括轨迹曲率、加速度、速度、转向角度四个变量;提取的特征分为两类:统计特征和时间特征;所述统计特征包括:平均值、方差、ACF1、余数自相关、趋势、曲率和熵;所述时间特征包括:最大平均值差值、最大方差差值、Kullback-Leibler散度的最大位移和余数方差。


3.根据权利要求1所述的驾驶行为无监督模式识别方法,其特征在于,所述步骤S2具体包括:
S200、输入特征样本数据集Q={xs|s=1,...,N};
S201、令k为自1至kmax的循环,计算聚类数目为k时的聚类簇,其中kmax为最大聚类数目;
S202、在特征样本数据集Q中随机选择k个样本点,分别赋给初始聚类中心μ1,μ2,...,μb,...,μk;
S203、令s为1-N的循环,其中N代表待聚类样本的个数,计算样本xb与各个聚类中心μb的距离d(xs,μb);
S204、找出xs关于聚类中心μb的最小距离,将xs归入到关于μb距离最小的簇Cb中;
S205、更新各个类簇的聚类中心,如果新的聚类中心与原聚类中心不相等,则更新聚类中心;
S206、重复步骤S203-步骤S205,直至聚类中心不再更新为止;
S207、计算当前聚类误差平方和SSEk;
S208、计算当前聚类误差平方和与上一个聚类误差平方和的差值,即下降幅度ΔSSEk=SSEk-1-SSEk;
S209、计算下降幅度变化差值,即ΔΔSSEk=ΔSSEk-1-ΔSSEk;
S210、重复步骤S201-步骤S209,直至k=kmax;
S211、最优聚类个数为ΔΔSSEk最大的时候k的取值,此时聚类结果即为最优聚类结果;
S212、输出聚类结果。


4.根据权利要求3所述的驾驶行为无监督模式识别方法,其特征在于,Wasserstein距离定义如下:
假设和代表了两个分布,它们之间的距离通过以下公式计算:



其中是和分布组合起来的所有可能的联合分布的集合,π代表和所表示的其中一个联合分布,E(m,n)~Π[||m-n||]计算了在当前联合分布π的条件下两个分布的距离期望值;对所有的联合分布进行计算后,利用取得所有期望的下界,即为Wasserstein距离数值;
令子序列集描述为X=(x1,...,xs,...,xN),其中xs=(xs1,xs2,...,xsf,...,xsl)T,N为数据集样本总数,l为子序列特征的维度,k是聚类数目,聚类中心向量为{μ1,μ2,...,μb,...,μk};样本xs与聚类中心μb的距离为:



Π(xs,μb)是xs和μb分布组合起来的所有可能的联合分布的集合,Π代表xs和μb所表示的其中一个联合分布;其中xsf,μbf分别代表了xs与μb的第f个特征。


5.根据权利要求4所述的驾驶行...

【专利技术属性】
技术研发人员:王玲
申请(专利权)人:北京科技大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1