本发明专利技术公开了一种基于k
【技术实现步骤摘要】
一种基于k
‑
mediods算法的非法营运车辆识别方法
[0001]本专利技术涉及一种基于k
‑
mediods算法的非法营运车辆识别方法,属于城市交通大数据的
技术介绍
[0002]非法营运是指没有依法取得营运权而实施了盈利性营运的行为。非法营运问题影响了城市交通的良性发展,扰乱了市场经营秩序,危害公众的生命财产安全,同时也增加了有关部门的监管难度。非法营运车辆,俗称“黑车”是指未经行业主管部门批准,非法运营的各类车辆的统称。在实际生活中,执法人员对“黑车”的整治存在很多困难,主要有:1)证据获取难。部分“黑车”司机以合法形式来掩盖其非法运营行为,执法取证有难度,打击起来非常困难。2)“黑车”查处难。为逃避执法部门的查处,“黑车”已经呈现出“由固定地点等客,变为随时流动营运”的特点,很难现场查处。
技术实现思路
[0003]本专利技术所要解决的技术问题在于提供一种基于k
‑
mediods算法的非法营运车辆识别方法,能够准确识别非法营运车辆,降低执法部门对非法营运车辆的整治和查处难度,满足城市交通管理的需求。
[0004]为解决上述技术问题,本专利技术采用的技术方案如下:
[0005]一种基于k
‑
mediods算法的非法营运车辆识别方法,包括以下步骤,
[0006](1)将车辆运行信息存储于车辆信息数据库;
[0007](2)对车辆信息数据库进行预处理,包括:分析车辆信息并提取车辆运行的行为特征数据,建立数据仓库并定时更新;
[0008](3)对数据仓库中的车辆运行的行为特征数据进行PCA处理;
[0009](4)利用k
‑
mediods算法进行聚类分析,得到车辆分类识别结果中的非法营运车辆信息,并将其存入非法营运车辆信息数据库;
[0010](5)将运行的车辆信息与非法营运车辆信息数据库进行比对,若运行的车辆信息在非法营运车辆信息数据库中,则此车辆被判定为非法营运车辆,反之被判定为合法车辆。
[0011]作为一种优选,上述的基于k
‑
mediods算法的非法营运车辆识别方法,所述步骤(2)中的车辆信息是通过RFID采集的数据,包括车牌号码、车辆通过地点、车辆通过时间;行为特征数据包括车牌号码、通过时间间隔、平均通过时长、时间间隔方差、通过频次、高峰时期通过占比。
[0012]作为一种优选,前述的基于k
‑
mediods算法的非法营运车辆识别方法,所述步骤(4)中的k
‑
mediods算法包括,
[0013]算法输入:包含n个对象的车辆运行信息,结果簇的个数k;算法输出:k个簇的集合,使得所有对象与其最近中心点的相异度总和最小方法;其具体步骤为:
[0014]1)从数据仓库中获取聚类分析车辆的数据信息O(n),需要聚类的个数k;
[0015]2)随机选择k个对象作为初始中心点;
[0016]3)将剩余对象分配到临近中心的簇,并计算此时的目标函数oldE;
[0017]4)随机产生一个代替原中心的对象Orand;
[0018]5)依次利用Orand代替原始的k个对象;
[0019]5.1)初始化即将替代的簇中心下标i=0;
[0020]5.2)判断是否遍历完所有簇中心,若遍历完则转向步骤6),否则转向5.3);
[0021]5.3)将剩余对象分配到临近中心的簇,计算目标函数newE;
[0022]5.4)计算此时代价函数 S=newE-oldE,其中newE表示利用随机对象替换原簇中心之后的目标函数值,oldE表示原对象的目标函数值;若s<0,则可以替换原簇中心;反之,则不能替换原簇中心;
[0023]5.5)判断S是否小于0,若小于0则转向步骤5.7),否则转向下一步5.6);
[0024]5.6)下标i=i+1,转向5.2);
[0025]5.7)记录此时下标j=i,并用Orand代替Oj,转向步骤5.3);
[0026]6)结束。
[0027]作为一种优选,前述的基于k
‑
mediods算法的非法营运车辆识别方法,输入的 个对象的车辆信息,包含车牌号、已知的车辆类型以及经过PCA处理之后的车辆运行的行为特征数据,同时对这些行为特征数据进行了归一化处理,归一化处理公式如下:
[0028]其中,norci(p) 表示第i个对象在第p维特征数据经过归一化处理的结果;c表示车辆信息的对象;ci(p)表示第i个对象在第p维特征数据值;min(p)表示所有车辆信息中的第p维特征数据值的最小值;max(p) 表示所有车辆信息中的第p维特征数据值的最大值。作为一种优选,前述的基于k
‑
mediods算法的非法营运车辆识别方法,目标函数 的公式如下:
[0029]其中j表示聚类分析后簇的序号,范围为1到k;i为对象序号,范围为1到n;cj表示第j个簇的中心;xi表示第i个对象;dist表示求cj与xi欧式距离;其中dist(ci,xi)的公式如下:
[0030]其中cj(p)表示cj的第p个运行特征数据,m表示对象共有多少特征数据。本专利技术的有益效果:与现有技术相比,本专利技术大大提高了对非法营运车辆的识别准确性,可以完全识别出非法营运车辆,有效解决了目前对非法营运车辆整治和查处难的问题,大幅提高了城市交通管理水平,保障了市场经营秩序和公众的生命财产安全。本专利技术具有以下特点:(1)经过基于距离贡献率的算法改进之后,非法营运车辆正确识别数量显著提高,可以完全识别出非法营运车辆;错误识别数量也有明显下降。(2)经过基于偶然性的算法改进之后,在最佳k值的情况下也可以完全识别出非法营运车辆。(3)提高了算法稳定性和非法营运车
辆正确识别数量、降低了错误识别数量。
附图说明
[0031]图1是本专利技术的识别流程图;
[0032]图2是本专利技术RFID数据的k
‑
mediods算法流程图。
[0033]下面结合附图和具体实施方式对本专利技术作进一步的说明。
具体实施方式
[0034]实施例1:如图1所示,一种基于k
‑
mediods算法的非法营运车辆识别方法,包括以下步骤,
[0035](1)将车辆运行信息存储于车辆信息数据库;
[0036](2)对车辆信息数据库进行预处理,包括:分析车辆信息并提取车辆运行的行为特征数据,建立数据仓库并定时更新;其中的车辆信息是通过RFID采集的数据,包括车牌号码、车辆通过地点、车辆通过时间;行为特征数据包括车牌号码、通过时间间隔、平均通过时长、时间间隔方差、通过频次、高峰时期通过占比。
[0037](3)对数据仓库中的车辆运行的行为特征数据进行PCA处理;PCA处理之后得到6维车辆运行特征数据和每一维数据贡献率;k
‑
本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于k
‑
mediods算法的非法营运车辆识别方法,其特征在于:包括以下步骤,(1)将车辆运行信息存储于车辆信息数据库;(2)对车辆信息数据库进行预处理,包括:分析车辆信息并提取车辆运行的行为特征数据,建立数据仓库并定时更新;(3)对数据仓库中的车辆运行的行为特征数据进行PCA处理;(4)利用k
‑
mediods算法进行聚类分析,得到车辆分类识别结果中的非法营运车辆信息,并将其存入非法营运车辆信息数据库;(5)将运行的车辆信息与非法营运车辆信息数据库进行比对,若运行的车辆信息在非法营运车辆信息数据库中,则此车辆被判定为非法营运车辆,反之被判定为合法车辆。2.根据权利要求1所述的基于k
‑
mediods算法的非法营运车辆识别方法,其特征在于:所述步骤(2)中的车辆信息是通过RFID采集的数据,包括车牌号码、车辆通过地点、车辆通过时间;行为特征数据包括车牌号码、通过时间间隔、平均通过时长、时间间隔方差、通过频次、高峰时期通过占比。3.根据权利要求1所述的基于k
‑
mediods算法的非法营运车辆识别方法,其特征在于:所述步骤(4)中的k
‑
mediods算法包括,算法输入:包含n个对象的车辆运行信息,结果簇的个数k;算法输出:k个簇的集合,使得所有对象与其最近中心点的相异度总和最小方法;其具体步骤为:1)从数据仓库中获取聚类分析车辆的数据信息O
(n)
,需要聚类的个数k;2)随机选择k个对象作为初始中心点;3)将剩余对象分配到临近中心的簇,并计算此时的目标函数;oldE4)随机产生一个代替原中心的对象O
rand
;5)依次利用O
rand
代替原始的k个对象;5.1)初始化即将替代的簇中心下标i=0;5.2)判断是否遍历完所有簇中心,若遍历完则转向步骤6),否则转向5.3);5.3)将剩余对象...
【专利技术属性】
技术研发人员:徐桂林,沈志勇,杨嵘,杨智晨,周德松,邓朝江,
申请(专利权)人:贵州智诚科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。