System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于空间众包的动态订单配送方法及系统技术方案_技高网

基于空间众包的动态订单配送方法及系统技术方案

技术编号:44482901 阅读:0 留言:0更新日期:2025-03-04 17:49
本发明专利技术公开一种基于空间众包的动态订单配送方法及系统,方法包括:更新在当前决策点前成功分配的订单信息和处于配送状态的骑手的位置信息;读取新获取的订单信息和骑手信息;分配订单并规划骑手配送路线,具体地,根据订单信息和骑手信息,通过启发式贪心方法对所有未分配订单进行分配,使用最小距离插入方法将订单的起点、终点插入骑手的配送路线中,得到订单分配的初始解;使用超启发式框架调整初始解,具体地,计算初始解的状态,作为DQN网络的输入,根据输出算子对解进行调整得到新解;为订单调整的骑手重新规划配送路线,骑手开始配送;计算骑手相遇状态并调整订单,对骑手分配和路径规划进行优化,从而提升订单配送系统的总利润。

【技术实现步骤摘要】

本专利技术属于任务分配,具体涉及一种基于空间众包的动态订单配送方法及系统


技术介绍

1、随着互联网和智能设备的普及,为了方便,许多人更喜欢在线购买各种商品或服务。特别是在线配送服务(online delivery,od),近年来越来越受欢迎,这种服务首先由人(即顾客)下单,然后由供应商准备,最后由骑手完成配送。

2、目前,已经出现了大量的众包在线配送系统,提供各种服务。一个典型的众包在线配送(crowdsourcing online delivery,cod)系统有四个利益相关者,即平台、众包骑手、供应商(如食品、药品供应商)和顾客。

3、cod系统的框架描述如下:

4、由于订单和骑手的动态性,平台需要一个订单到达后的即时分配机制。作为cod系统的核心,该平台在订单分配过程中面临两大挑战。一是平台应该鼓励更多的众包骑手参与配送,因为很多众包骑手除了参与配送之外没有额外的收入。众包骑手愿意一次运送更多的订单,以获得更多的利润。为了解决这个问题,该平台通常会分配一名骑手,负责多个目的地相似的订单。另一个挑战是系统环境中的巨大动态和不确定性。在cod系统中,顾客的在线订单动态到达平台,众包骑手随机分布在供应商周围。动态和不确定性给订单分配带来了巨大的挑战,特别是在繁忙时间(如上下班时间)。寻找大规模实例的全局最优解是np-hard,通常需要指数级的资源。为了应对这些挑战,使用启发式方法在合理的时间内找到高质量的解决方案。除了启发式方法外,还采用了各种策略来优化订单的分配。例如,一些研究采用了延迟策略,将尚未准备好的订单分配给骑手,让骑手在前往订单目的地的途中等待订单完成。此外,为了应对未来环境的动态性和不确定性,已经提出了多种基于预测的方法。这些基于预测的策略利用大量历史数据来训练模型,预测未来的特征,并将这些预测应用于订单分配方法中。尽管实验结果表明这些策略的有效性,但由于历史数据的不足以及计算资源的限制,这些策略可能并不总是成功的。

5、总体而言,cod系统的设计和优化是一个复杂的问题,需要综合考虑订单分配、骑手激励、动态环境适应性以及预测方法等多个方面。


技术实现思路

1、为了解决现有技术中存在的问题,本专利技术提供一种基于空间众包的动态订单配送方法,使用启发式方法实现众包在线配送服务的即时分配机制,提出两阶段订单调整策略,对骑手分配和路径规划进行优化,从而提升订单配送系统的总利润,构建高效的订单配送服务。

2、为了实现上述目的,本专利技术采用的技术方案是:一种基于空间众包的动态订单配送方法,包括以下步骤:

3、更新在当前决策点前成功分配的订单信息和处于配送状态的骑手信息;读取新进入系统的订单信息和骑手信息;

4、分配订单并规划骑手配送路线,具体地,根据订单信息和骑手信息,通过启发式贪心方法对所有未分配订单进行分配,使用最小距离插入方法将订单的起点、终点插入骑手的配送路线中,得到订单分配的初始解;

5、使用超启发式框架调整初始解,具体地,计算初始解的状态,作为dqn网络的输入,根据输出算子对解进行调整得到新解;为订单调整的骑手重新规划配送路线,骑手开始配送;

6、计算骑手相遇状态并调整订单,包括:根据骑手的相遇半径,计算时刻系统中所有骑手的相遇状态,随机选择相遇骑手,尝试进行订单调整操作,如果调整后利润增加,则执行订单调整操作,并重新为骑手规划配送路线;否则不执行订单调整操作;完成上述操作后,骑手继续配送;

7、循环以上步骤。

8、进一步的,更新在当前决策点前成功分配的订单信息和处于配送状态的骑手的位置信息;读取新获取的订单信息:

9、订单信息和骑手信息定义,订单由顾客通过在线平台提交,一个订单由其id、起始时间、截止日期、开始位置、目标位置以及奖励预算组成,表示为;骑手从平台上接收订单,从供应商取货,将物品交付到客户手中,骑手由他/她的id、当前位置、总容量、当前剩余容量、分配订单组成,表示为;

10、更新系统前序分配的订单信息,更新未分配订单的状态:检查订单是否超时,如果超时则从系统中删除,否则在下一决策点重新分配;更新处于配送状态的订单,检查订单是否取货/送达,更新为对应的状态;

11、读取当前决策点与上一决策点之间获取的订单信息以及上一决策点分配失败的订单信息,共同构成本决策点将进行分配的订单列表;获取在线的众包骑手列表,作为订单分配的可用骑手。

12、进一步地,所述深度强化学习超启发式框架构建并训练时:构建深度神经网络,用于从数据集中学习订单和骑手特征到订单调整策略的映射,对环境状态进行评估以选择动作;使用经验回放机制和策略,分别用于存储和重用历史交互经验,构建目标网络,构建完成后使用订单训练集和骑手训练集进行训练。

13、进一步地,深度强化学习超启发式框架中智能体考虑搜索过程中的额外信息,如骑手信息、订单信息、系统信息作为当前环境的状态,具体如下:

14、①骑手状态信息

15、骑手状态信息包括骑手的总剩余容量、活跃骑手数量,将两者加权后作为骑手的状态信息,具体计算公式如下:

16、

17、②订单状态信息

18、订单状态信息包括当前时刻系统中已分配订单数量、已完成订单数量,计算公式如下:

19、

20、③系统状态信息

21、系统状态信息为本次解和上次解的利润差值,表示为:

22、

23、其中,均为权重参数,最终环境状态表示为:

24、。

25、进一步的,所述深度强化学习超启发式框架构建并训练具体包括以下步骤:

26、s1,构建训练网络,定义网络的输入,维度为状态的维度,使用全连接层和relu激活函数构建dqn网络,学习状态和动作之间的映射关系,输出向量代表在当前状态下执行对应动作的估计价值,维度为可选动作的数量;

27、s2,初始化训练网络、目标网络以及经验回放池r,随机初始化训练网络的参数,复制训练网络的参数初始化目标网络,初始化经验回放池r,设置经验回放池容量,存储智能体与环境交互的经验元组;

28、s3,将s4-s9执行设定次数,使用订单训练集和骑手训练集进行训练;

29、s4,获取环境初始状态,根据训练网络的输出使用策略选择动作;

30、s5,执行动作,获得奖励,环境状态变为;

31、s6,将经验元组放入经验回放池r中;

32、s7,如果经验回放池r的数据量足够,从中随机采样n个数据;对于每个采样的数据,使用目标网络计算目标值,其中是折扣因子,取值范围为[0,1];

33、s8,最小化目标损失,以此更新训练网络的参数,即;

34、s9,定期更新目标网络的参数,即。

35、进一步的,启发式贪心方法动态分配到达的配送订单包括:

36、s11,获取本文档来自技高网...

【技术保护点】

1.一种基于空间众包的动态订单配送方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于空间众包的动态订单配送方法,其特征在于,更新在当前决策点前成功分配的订单信息和处于配送状态的骑手信息;读取新进入系统的订单信息和骑手信息包括:

3.根据权利要求1所述的基于空间众包的动态订单配送方法,其特征在于,所述深度强化学习超启发式框架构建并训练时:构建深度神经网络,用于从数据集中学习订单和骑手特征到订单调整策略的映射,对环境状态进行评估以选择动作;使用经验回放机制和策略,分别用于存储和重用历史交互经验,以及权衡探索和利用;构建目标网络,构建完成后使用订单训练集和骑手训练集进行训练。

4.根据权利要求3所述的基于空间众包的动态订单配送方法,其特征在于,深度强化学习超启发式框架中智能体考虑搜索过程中的额外信息,如骑手信息、订单信息、系统信息作为当前环境的状态,具体如下:

5.根据权利要求3所述的基于空间众包的动态订单配送方法,其特征在于,所述深度强化学习超启发式框架构建并训练具体包括以下步骤:

6.根据权利要求1所述的基于空间众包的动态订单配送方法,其特征在于,启发式贪心方法动态分配到达的配送订单包括:

7.根据权利要求1所述的基于空间众包的动态订单配送方法,其特征在于,计算骑手相遇状态并调整订单时,基于众包骑手间的协作,具体包括:

8.一种基于空间众包的动态订单配送系统,其特征在于,包括信息循环更新模块、初始解获取模块、分配模块以及调整交换模块;

9.一种计算机设备,其特征在于,包括处理器以及存储器,存储器用于存储计算机可执行程序,处理器从存储器中读取部分或者全部所述计算机可执行程序并执行,处理器执行部分或全部计算可执行程序时能实现权利要求1-7任一项所述的基于空间众包的动态订单配送方法。

10.一种计算机可读存储介质,其特征在于,计算机可读存储介质中存储有计算机程序,所述计算机程序被处理器执行时,能实现权利要求1-7任一项所述基于空间众包的动态订单配送方法。

...

【技术特征摘要】

1.一种基于空间众包的动态订单配送方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于空间众包的动态订单配送方法,其特征在于,更新在当前决策点前成功分配的订单信息和处于配送状态的骑手信息;读取新进入系统的订单信息和骑手信息包括:

3.根据权利要求1所述的基于空间众包的动态订单配送方法,其特征在于,所述深度强化学习超启发式框架构建并训练时:构建深度神经网络,用于从数据集中学习订单和骑手特征到订单调整策略的映射,对环境状态进行评估以选择动作;使用经验回放机制和策略,分别用于存储和重用历史交互经验,以及权衡探索和利用;构建目标网络,构建完成后使用订单训练集和骑手训练集进行训练。

4.根据权利要求3所述的基于空间众包的动态订单配送方法,其特征在于,深度强化学习超启发式框架中智能体考虑搜索过程中的额外信息,如骑手信息、订单信息、系统信息作为当前环境的状态,具体如下:

5.根据权利要求3所述的基于空间众包的动态订单配送方法,其特征在于,所述...

【专利技术属性】
技术研发人员:张立臣张扬扬李彤卢子娟魏子佳郭龙江
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1