基于多时空聚类的出租车载客点推荐方法技术

技术编号:27307649 阅读:51 留言:0更新日期:2021-02-10 09:24
本发明专利技术公开了一种可提高推荐精确度的基于多时空聚类的出租车载客点推荐方法,依次按照如下步骤进行:对出租车原始轨迹数据进行预处理,移除出租车轨迹噪点;从预处理后的轨迹数据中提取出租车历史载客点信息;利用多时空聚类方法对出租车历史载客点进行聚类;根据目标出租车实时请求信息,产生多个候选载客点聚类簇;利用实时流行度、平均速度和距离信息为每个候选载客点聚类簇计算推荐度;选取推荐度最高的N个载客点聚类簇作为推荐结果提供给目标出租车。标出租车。标出租车。

【技术实现步骤摘要】
基于多时空聚类的出租车载客点推荐方法


[0001]本专利技术涉及推荐
,尤其涉及一种可提高推荐精确度的基于多时空聚类的出租车载客点推荐方法。

技术介绍

[0002]随着GPS移动设备在城市车辆中的广泛应用,每天都有大量的车辆轨迹信息产生,合理利用车辆轨迹信息可实现城市智能交通规划。对车辆轨迹信息进行聚类是处理轨迹数据的最有效方法之一,可为出租车推荐载客点,避免出租车随机地在街道上巡航,降低出租车的载客成本。然而,现有的载客点推荐方法无法对类似城市道路轨迹点等非凸数据进行合理聚类且应用全局信息进行静态推荐,往往会为一个区域内所有的出租车推荐相似载客点,导致多台出租车一同前往推荐地,进而引起交通拥堵。

技术实现思路

[0003]本专利技术是为了解决现有技术所存在的上述技术问题,提供一种可提高推荐精确度的基于多时空聚类的出租车载客点推荐方法。
[0004]本专利技术的技术解决方案是:一种基于多时空聚类的出租车载客点推荐方法,其特征在于依次按照如下步骤进行:步骤1.对出租车原始轨迹数据进行预处理,移除出租车轨迹噪点;所述出租车轨迹噪点分为两类:一类为出租车一天内运营状态下始终为空驶或者载客状态的轨迹,另一类是出租车状态显示错误的轨迹;步骤2.从去除噪点的轨迹数据中提取历史出租车载客点;所述出租车载客点为轨迹数据中的数据点,当出租车处于此数据点时速度为零且状态为空驶,驶离此数据点时的状态从空驶变为载客;步骤3.利用多时空聚类方法对出租车历史载客点进行聚类;步骤3.1.令提取出来的出租车载客点组成矩阵O=[o1,o2,

,o
m
]T
,其中m表示出租车载客点的数目,o
i
表示第i个载客点;从O中随机选择n个特殊点组成矩阵S=[s1,s2,

,s
n
]T
,其中n表示特殊点的数目,s
j
表示第j个特殊点;步骤3.2.利用公式(1)计算载客点o
i
和特殊点s
j
包含时间因素的距离:
ꢀꢀ
(1)式(1)中,表示衰减率;和分别表示载客点o
i
和特殊点s
j
的当前时间;和分别表示载客点o
i
和特殊点s
j
的经度;和分别表示载客点o
i
和特殊点s
j
之间的经度差和纬度差;步骤3.3.通过求解公式(2),将载客点和特殊点划分为K个载客点聚类簇:

(2)式(2)中, 表示载客点o
i
和特殊点s
j
之间的连接概率,表示正则化参数,表示矩阵P的弗罗宾尼斯范数;步骤4.根据目标出租车的实时请求信息,产生候选载客点聚类簇;根据目标出租车发出寻求乘客需求信息的当前时间t,将距离目标出租车位置最近的多个载客点聚类簇作为向目标出租车推荐的候选载客点聚类簇;步骤5.根据公式(3)计算候选载客点聚类簇推荐度RD(t);
ꢀꢀ
(3)所述HP(t)为实时流行度,是指在时间点t之前候选载客点聚类簇包含的所有历史乘车点数目;所述AS(t)为平均速度,是指在时间点t时,候选载客点聚类簇内所有出租车的平均速度;所述Dis(t)为距离信息,是指在时间点t时,候选载客点聚类簇中心点与目标出租车之间的距离;步骤6.选取推荐度最高的N个载客点聚类簇推荐给目标出租车。
[0005]本专利技术与现有技术相比,具有如下优点:1.本专利技术首次提出了多时空载客点聚类算法,可以根据出租车载客点时空分布非凸性的特点,将分布于城市道路上的载客点有效地聚为相应的类簇内,从而有效地解决传统聚类方法无法将非凸数据样本有效聚类的问题;2.本专利技术对出租车载客点引入一种实时推荐度的概念,可从目标出租车发出的实时需求出发,从实时流行度、平均速度和距离信息入手,通过实时计算候选载客点聚类簇的推荐度,为不同的出租车提供不同类型的推荐结果,有效地提高了出租者载客点推荐的精度,从而提高出租车司机的载客率,同时可避免多台出租车一同前往载客点所引起的交通拥堵。
附图说明
图1为本专利技术的流程示意图。
[0006]图2为本专利技术实施例与现有技术Precision度量随着推荐数量的变化而相应的结果示意图。
[0007]图3为本专利技术实施例与现有技术Recall度量随着推荐数量的变化而相应的结果示意图。
[0008]图4为本专利技术实施例与现有技术F1度量随着推荐数量的变化而相应的结果示意图。
具体实施方式
[0009]本专利技术的一种基于多时空聚类的出租车载客点推荐方法如图1所示,依次按照如下步骤进行:
步骤1.对出租车原始轨迹数据进行预处理,移除出租车轨迹噪点;虽然出租车有运行轨迹,但由于通信设备传输问题,有时出租车状态始终(以一天内初始至结束)为空驶或者载客状态,另外由于乘客临时取消打车服务等造成出租车状态信息没有及时更新而显示错误,故出租车轨迹噪点分为两类:一类为出租车始终为空驶或者载客状态的轨迹,另一类是出租车状态显示错误的轨迹;某台出租车的部分轨迹数据如表1所示。
[0010]表1表1中,在P3数据点时,出租车的速度不为0,因此P3数据点可能是由于乘客临时取消了打车服务而被称为误标记数据点,类似P3数据点类型的数据点都将被看作为噪点而去除。
[0011] 去除噪点的轨迹数据如表2所示。
[0012]表2步骤2.从去除噪点的轨迹数据中提取历史出租车载客点;所述出租车载客点为轨迹数据中的数据点,当出租车处于此数据点时速度为零且状态为空驶,驶离此数据点时的状态
从空驶变为载客,从表2可以看出只有P6数据点是出租车载客点。
[0013]据此,2007年2月20日上海地区的出租车轨迹数据的6075587数据点中提取的77405个载客点。
[0014]步骤3.利用多时空聚类方法对出租车历史载客点进行聚类;步骤3.1.令提取出来的出租车载客点信息组成矩阵O=[o1,o2,

,o
m
]T
,其中m表示出租车载客点的数目,o
i
表示第i个载客点;从O中随机选择n个特殊点组成矩阵S=[s1,s2,

,s
n
]T
,其中n表示特殊点的数目,s
j
表示第j个特殊点;步骤3.2.利用公式(1)计算载客点o
i
和特殊点s
j
包含时间因素的距离:
ꢀꢀ
(1)式(1)中,表示衰减率,如果=24小时,则表示时间按照以天为单位进行衰减;和分别表示载客点o
i
和特殊点s
j
的当前时间;和分别表示载客点o
i
和特殊点s
j
的经度;和分别表示载客点o
i
和特殊点s
j
之间的经度差和纬度差;例如表3所示,5个载客点和4个特殊点之间的距本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多时空聚类的出租车载客点推荐方法,其特征在于依次按照如下步骤进行:步骤1.对出租车原始轨迹数据进行预处理,移除出租车轨迹噪点;所述出租车轨迹噪点分为两类:一类为出租车一天内运营状态下始终为空驶或者载客状态的轨迹,另一类是出租车状态显示错误的轨迹;步骤2.从去除噪点的轨迹数据中提取历史出租车载客点;所述出租车载客点为轨迹数据中的数据点,当出租车处于此数据点时速度为零且状态为空驶,驶离此数据点时的状态从空驶变为载客;步骤3.利用多时空聚类方法对出租车历史载客点进行聚类;步骤3.1.令提取出来的出租车载客点组成矩阵O=[o1,o2,

,o
m
]
T
,其中m表示出租车载客点的数目,o
i
表示第i个载客点;从O中随机选择n个特殊点组成矩阵S=[s1,s2,

,s
n
]
T
,其中n表示特殊点的数目,s
j
表示第j个特殊点;步骤3.2.利用公式(1)计算载客点o
i
和特殊点s
j
包含时间因素的距离:
ꢀꢀ
(1)式(1)中,表示衰减率;和分别表示载客点o
...

【专利技术属性】
技术研发人员:张志鹏张尧任永功
申请(专利权)人:辽宁师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1