一种出租车调度方法技术

技术编号：38162519 阅读：24 留言：0更新日期：2023-07-13 09:36

本发明专利技术涉及车辆调度技术领域，公开了一种出租车调度方法，包括以下步骤：将出租车调度问题构建为一个马尔可夫决策元组；构建网格地图；预测者智能体接收到从环境中观测到的全局订单时空分布，将其划分为基于分钟的历史订单与基于天数的历史订单两种类型；使用多视图时空卷积注意力模块结合上述两种类型的历史订单分布预测各区域的未来出行需求；工人智能体接收到所述预测者智能体所预测的潜在订单分布，结合推算的潜在车辆分布，计算区域的供需特征，形成需求指数与区域标记；相邻的工人智能体通过消息模块来分享所述需求指数与所述区域标记这两个信息，再使用超参数自注意力模块学习出租车调度策略；验证上述策略，形成最终模型。终模型。终模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种出租车调度方法

[0001]本专利技术涉及车辆调度
，特别是涉及一种基于预分配层次强化学习的出租车调度方法。

技术介绍

[0002]拼车系统广泛部署在许多大城市中，其通过智能算法实现乘客预订和调度附近可用的车辆，显著改善了日常出行。尽管这些平台广受欢迎，但仍面临着需求供给不平衡的巨大挑战。例如，高人口密度的热区域通常缺乏可用车辆，导致许多乘车请求无法得到满足；而低需求的冷区域可能有过剩的闲置车辆，等待可能不会到来的乘车请求。这些需求供给不匹配可能会导致乘客满意度降低，也会减少拼车平台和司机的利益。
[0003]基于组合优化算法，如贪婪算法和启发式算法等，首先被提出并用于出租车车队的调度管理，然而，这些算法大多集中在短期重新定位，在长期规划方面有较低的效率，忽略了需求的变化和不确定性的影响。因此，需要一种能够考虑长期目标和需求预测的方式。
[0004]目前，基于强化学习的算法已被应用于解决出租车车队调度问题。这些算法将每个可用的车辆视为一个自主智能体，利用神经网络为每个智能体学习调度策略，能够在提高订单响应率和平台收入方面取得一定的效果。然而，基于传统强化学习的算法仍然面临着很多的技术挑战。首先，它们需要定义智能体的状态和动作空间，并协调智能体之间的协作，因为车队管理策略需要在城市范围内匹配数以万计的车辆和出行请求。其次，它们还必须能够准确预测潜在的乘客需求，这需要有效地整合预测模型和车队调度模型。第三，它们的最终挑战是如何基于预测结果生成长期的车队调度策略，以实现平台的可持续发展。
...

【技术保护点】

【技术特征摘要】
1.一种出租车调度方法，其特征在于：包括以下步骤：S1，将出租车调度问题构建为一个马尔可夫决策元组；其中，该马尔可夫决策元组包括智能体，所述智能体包括负责调度车辆的工人智能体和负责预测未来的出行需求的预测者智能体；S2，构建网格地图；其中，每个网格代表一个区域，每个网格内可以拥有多个订单与司机；S3，所述预测者智能体接收到从环境中观测到的全局订单时空分布，将其划分为基于分钟的历史订单与基于天数的历史订单两种类型；S4，使用多视图时空卷积注意力模块结合上述两种类型的历史订单分布预测各区域的未来出行需求；S5，所述工人智能体接收到所述预测者智能体所预测的潜在订单分布，结合推算的潜在车辆分布，基于预分配规则计算区域的供需特征，形成需求指数与区域标记；S6，相邻的工人智能体通过消息模块来分享所述需求指数与所述区域标记这两个信息，再使用超参数自注意力模块学习出租车调度策略；S7，验证上述策略，并形成最终模型。2.如权利要求1所述的出租车调度方法，其特征在于：所述马尔可夫决策元组 G=（N，S，A，P，R，γ）；其中N是工人智能体的数量，S表示环境中的状态集，A表示行动集，P是状态转移概率，R表示奖励函数，γ表示折扣因子。3.如权利要求2所述的出租车调度方法，其特征在于：所述预测者智能体的奖励函数为，且：，其中，和分别表示t+1时刻时全城实际订单和预测订单的分布；表示Kullback
‑
Leibler距离，它显示了时刻t+1时真实订单和预测出行需求之间的差距；所述工人智能体的奖励函数为，且：；其中，代表网格i中的车辆所获得的直接订单匹配奖励收入；网格i中的剩余车辆没有获得直接奖励，而是根据其周围的潜在订单数量，获得与之成比例的奖励。4.如权利要求1所述的出租车调度方法，其特征在于：构建所述网格地图，将城市分区成六边形格网世界，每个格网被视为一个代理，具有唯一的格网ID ，并拥有多个同质化的空闲车辆；且所述六边形格网的边缘大小设置为2~3公里。5.如权利要求1所述的出租车调度方法，其特征在于：环境中观察到的历史订单分布数据被用于预测t+1时间步的目标需求；其中时间步t
‑
n到t中的基于分钟的历史订单分布被选为预测者智能体输入的一部分，以研究连续n个时间段内旅行需求的变化趋势；
最近n天时间步t+1的基于天的历史订单分布被选为...

【专利技术属性】
技术研发人员：黄晓辉，凌嘉壕，成学博，许嘉杨，祝显红，
申请(专利权)人：华东交通大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人