【技术实现步骤摘要】
一种驾驶行为无监督模式识别方法及数据采集监控系统
本专利技术涉及驾驶行为无监督模式识别及预测监控
,特别涉及一种驾驶行为无监督模式识别方法及数据采集监控系统。
技术介绍
近年来,我国的机动车行业发展迅速。2020年,国内汽车保有量已经达到2.7亿辆,驾驶人员达4.1亿,机动车、驾驶人总量及增量均居世界第一。然而,伴随汽车保有量的提高,交通管理工作存在的深层次矛盾逐渐显现出来。我国是世界上道路交通事故最多的国家之一。根据国家统计局公布的数据,我国每万车的死亡率已经达到了惊人的6.2,这一数据已经达到了发达国家的4到8倍,由此看来,我国对不良驾驶行为的监管任务任重道远。因此,无论是运输企业还是政府相关部门,都应该对道路交通安全问题给予高度重视。大量事故案例的分析表明,虽然导致交通事故的成因多种多样,但人为原因始终是事故发生的主要因素。驾驶员的异常驾驶行为往往会成为重大交通事故的诱因。因此,如果能够有效识别异常驾驶行为,并及时对驾驶员发出警报,就能够在一定程度上避免道路交通事故。另一方面,有效识别异常驾驶行为也能够帮助交通部门与运营企业实现安全形势的动态监管和评价,提升安全管理水平。为了节约成本,使用车辆GPS、速度、加速度等信息进行监控和预警成为当前研究的热点。通过分析国内外相关资料可知,异常驾驶行为的识别方法已经有效运用于驾驶员行为管理等一系列的安全监管领域,提高了监管水平,降低了事故发生概率。因此,为了有效提高交通行业的安全监管,对车辆监控数据进行深层次的分析与应用势在必行。尽管如此,当前的异常 ...
【技术保护点】
1.一种驾驶行为无监督模式识别方法,其特征在于,包括以下步骤:/nS1、采集驾驶员在驾驶过程中的驾驶数据片段并进行特征提取;/nS2、利用改进的基于Wasserstein距离的自适应K-Means聚类算法对提取的特征进行聚类,获得驾驶行为模式;/nS3、建立驾驶行为主题描述,利用LDA模型将驾驶行为主题描述与所有聚类获得的驾驶行为模式进行匹配,得到无监督驾驶行为的识别结果。/n
【技术特征摘要】
1.一种驾驶行为无监督模式识别方法,其特征在于,包括以下步骤:
S1、采集驾驶员在驾驶过程中的驾驶数据片段并进行特征提取;
S2、利用改进的基于Wasserstein距离的自适应K-Means聚类算法对提取的特征进行聚类,获得驾驶行为模式;
S3、建立驾驶行为主题描述,利用LDA模型将驾驶行为主题描述与所有聚类获得的驾驶行为模式进行匹配,得到无监督驾驶行为的识别结果。
2.根据权利要求1所述的驾驶行为无监督模式识别方法,其特征在于,在所述步骤S1中,所述驾驶数据片段包括轨迹曲率、加速度、速度、转向角度四个变量;提取的特征分为两类:统计特征和时间特征;所述统计特征包括:平均值、方差、ACF1、余数自相关、趋势、曲率和熵;所述时间特征包括:最大平均值差值、最大方差差值、Kullback-Leibler散度的最大位移和余数方差。
3.根据权利要求1所述的驾驶行为无监督模式识别方法,其特征在于,所述步骤S2具体包括:
S200、输入特征样本数据集Q={xs|s=1,...,N};
S201、令k为自1至kmax的循环,计算聚类数目为k时的聚类簇,其中kmax为最大聚类数目;
S202、在特征样本数据集Q中随机选择k个样本点,分别赋给初始聚类中心μ1,μ2,...,μb,...,μk;
S203、令s为1-N的循环,其中N代表待聚类样本的个数,计算样本xb与各个聚类中心μb的距离d(xs,μb);
S204、找出xs关于聚类中心μb的最小距离,将xs归入到关于μb距离最小的簇Cb中;
S205、更新各个类簇的聚类中心,如果新的聚类中心与原聚类中心不相等,则更新聚类中心;
S206、重复步骤S203-步骤S205,直至聚类中心不再更新为止;
S207、计算当前聚类误差平方和SSEk;
S208、计算当前聚类误差平方和与上一个聚类误差平方和的差值,即下降幅度ΔSSEk=SSEk-1-SSEk;
S209、计算下降幅度变化差值,即ΔΔSSEk=ΔSSEk-1-ΔSSEk;
S210、重复步骤S201-步骤S209,直至k=kmax;
S211、最优聚类个数为ΔΔSSEk最大的时候k的取值,此时聚类结果即为最优聚类结果;
S212、输出聚类结果。
4.根据权利要求3所述的驾驶行为无监督模式识别方法,其特征在于,Wasserstein距离定义如下:
假设和代表了两个分布,它们之间的距离通过以下公式计算:
其中是和分布组合起来的所有可能的联合分布的集合,π代表和所表示的其中一个联合分布,E(m,n)~Π[||m-n||]计算了在当前联合分布π的条件下两个分布的距离期望值;对所有的联合分布进行计算后,利用取得所有期望的下界,即为Wasserstein距离数值;
令子序列集描述为X=(x1,...,xs,...,xN),其中xs=(xs1,xs2,...,xsf,...,xsl)T,N为数据集样本总数,l为子序列特征的维度,k是聚类数目,聚类中心向量为{μ1,μ2,...,μb,...,μk};样本xs与聚类中心μb的距离为:
Π(xs,μb)是xs和μb分布组合起来的所有可能的联合分布的集合,Π代表xs和μb所表示的其中一个联合分布;其中xsf,μbf分别代表了xs与μb的第f个特征。
5.根据权利要求4所述的驾驶行...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。