当前位置: 首页 > 专利查询>清华大学专利>正文

车辆路径规划方法及装置制造方法及图纸

技术编号:35927346 阅读:34 留言:0更新日期:2022-12-14 10:11
本发明专利技术提供一种在非配对派送和捡收情况下的车辆路径规划方法及装置,属于车辆路径规划技术领域。方法包括:调度步骤,利用策略模型计算可访问站点的备选概率值;将备选概率值最大的站点分配给车辆,作为车辆的备选目的地;更新步骤;第一判断步骤,若站点状态及车辆的剩余容量更新后,可访问站点的集合不为空,则重复调度步骤;若否,将仓库作为车辆的下一目的地;处理步骤,确定车辆从仓库出发时装载的货物量;第二判断步骤,判断是否存在未被访问的站点,若存在未被访问的站点,返回调度步骤,若不存在未被访问的站点,转向策略输出步骤;策略输出步骤,根据为车辆分配的站点输出路径规划策略。本发明专利技术能够提高路径规划策略的生成速度。速度。速度。

【技术实现步骤摘要】
车辆路径规划方法及装置


[0001]本专利技术涉及物流配送中的非配对待捡收和派送的车辆路径规划
,特别是指一种车辆路径规划方法及装置。

技术介绍

[0002]物流行业是一种兼顾成本和服务质量的服务行业。在为客户提供物流配送服务时,物流服务提供者需要提供高效的准时的服务,同时尽可能的降低服务的成本。
[0003]物流配送是物流服务的关键环节,是指根据客户对货物运输的时间和运量等的要求,将货物从出发地运送到目的地的过程。物流服务提供者一般在满足客户要求的前提下,为了降低配送成本,尽量减少配送用车辆的行驶时间。
[0004]非配对的待捡收和派送车辆路径规划问题是解决物流配送的经典问题,也是运筹学的经典问题,其目标是给定一组具有不同派送或捡收需求量的站点(同一站点不同时拥有派送和捡收需求)和一组有容量等限制的配送车辆,求取完成配送时配送车辆的行驶路径,使所有车辆总的行驶时间(行驶路径)最短。
[0005]相关技术中,通过启发式算法来进行车辆路径规划,但派送策略的生成速度较慢,且不能很好地协调车辆之间的合作。

技术实现思路

[0006]本专利技术要解决的技术问题是提供一种非配对待捡收和派送的车辆路径规划方法及装置,能够提高路径规划策略的生成速度并且有效考虑车辆装载量的设置。
[0007]为解决上述技术问题,本专利技术的实施例提供技术方案如下:
[0008]一方面,提供一种车辆路径规划方法,用于规划车辆访问多站点的路径和车辆从仓库出发时的装载量,所述多站点包括待派送站点和待捡收站点,所述方法包括:
[0009]调度步骤,利用预先训练的策略模型计算可访问站点的备选概率值,所述策略模型的输入包括每个站点的嵌入表征向量和全局表征向量,输出为每个站点的备选概率值;将备选概率值最大的站点分配给所述车辆,作为所述车辆的备选目的地;
[0010]更新步骤,更新站点的状态和所述车辆的剩余容量;
[0011]第一判断步骤,若站点状态及所述车辆的剩余容量更新后,可访问站点的集合不为空,则重复调度步骤;若否,将仓库作为所述车辆的下一目的地;
[0012]处理步骤,在所述车辆回到仓库时,根据所述车辆从仓库出发时的装载量在子路径中每一步收缩的取值范围确定所述车辆从仓库出发时装载的货物量,所述子路径为所述车辆从仓库出发然后首次回到仓库所经过的路径;
[0013]第二判断步骤,判断是否存在未被访问的站点,若存在未被访问的站点,返回所述调度步骤,若不存在未被访问的站点,转向策略输出步骤;
[0014]所述策略输出步骤,根据为所述车辆分配的站点输出路径规划策略,所述路径规划策略包括所述车辆访问站点的顺序。
[0015]本专利技术的可选实施例中,还包括训练策略模型的步骤,训练策略模型的步骤包括:
[0016]第一步骤,建立初始模型和参照模型,所述初始模型和参照模型的输入均为多个站点的位置、每个站点待投递的货物数量、每个站点待拾取的货物数量、车辆的容量,输出为每一站点的备选概率值;
[0017]第二步骤,分E次迭代,每次迭代中依次加载N批训练数据,每批训练数据包含B组训练数据,每组训练数据包括多个站点的位置、每个站点待投递的货物数量、每个站点待拾取的货物数量、车辆的容量,E,N,B均为大于1的整数;
[0018]第三步骤,在第j次迭代中,利用第i批B组训练数据和所述初始模型得到第i批B组训练数据中各组训练数据对应的路径规划策略的备选概率值分布pi,并根据所述路径规划策略计算第i批B组训练数据的第一损失值,j,i的初始值为1;
[0019]第四步骤,在第j次迭代中,利用第i批B组训练数据和所述参照模型得到第i批B组训练数据中各组训练数据对应的路径规划策略,并根据所述路径规划策略计算第i批B组训练数据的第二损失值,j,i的取值同第三步骤;
[0020]第五步骤,在第j次迭代中,利用第i批B组训练数据对应的所述第一损失值,第二损失值与路径规划策略的备选概率值分布pi,更新初始模型参数;
[0021]第六步骤,判断i的值是否等于N,若是,转向第七步骤,若否,将i的值加1,转向第三步骤;
[0022]第七步骤,利用验证集数据和更新后的初始模型得到所述验证集数据对应的初始模型策略,利用所述验证集数据和所述参照模型得到所述验证集数据对应的参照模型策略,并计算所述初始模型策略对应的备选概率值分布和所述参照模型策略对应的备选概率值分布的成对t检验结果;
[0023]第八步骤,若上述成对t检验结果小于预设阈值,将所述参照模型更新为与更新后的初始模型一致,若所述成对t检验结果不小于预设阈值,不更新所述参照模型;
[0024]第九步骤,判断j的值是否等于E,若是,转向第十步骤,若否,将j的值加1,i的值置为0,转向第三步骤;
[0025]第十步骤,输出当前的参照模型作为所述策略模型。
[0026]本专利技术的可选实施例中,所述更新步骤具体包括:
[0027]根据分配给所述车辆的站点的待拾取货物量和/或待派送货物量,以及车辆从仓库出发时的装载量的取值范围更新站点的状态和车辆的剩余容量。
[0028]本专利技术的可选实施例中,所述可访问站点是指根据所述车辆从仓库出发时的装载量的取值范围,以及所述车辆累计的待拾取货物量和待派送货物量,站点对应的待拾取货物量或待派送货物量,从所有未访问站点中筛选出的站点。
[0029]本专利技术的可选实施例中,还包括生成每个站点的嵌入表征向量和解码生成序列过程中上下文表征向量的步骤,所述步骤包括:
[0030]对每个站点的信息进行编码得到嵌入表征向量,所述站点的信息包括站点的位置、待拾取货物量和/或待派送货物量,该向量直接由编码器传递到解码器中;
[0031]使用图神经网络生成所有节点全连接形成的图的嵌入表征向量得到第一向量,使用序列嵌入方法对向量化处理后的节点进行嵌入表征得到第二向量,将所述第一向量与所述第二向量拼接得到所述解码生成序列过程中上下文表征向量。
[0032]本专利技术实施例还提供了一种车辆路径规划装置,用于规划车辆访问多站点的路径,所述多站点包括待派送站点和待捡收站点,所述装置包括:
[0033]调度模块,用于利用预先训练的策略模型计算可访问站点的备选概率值,所述策略模型的输入包括每个站点的嵌入表征向量和全局表征向量,输出为每个站点的备选概率值;将备选概率值最大的站点分配给所述车辆,作为所述车辆的备选目的地;
[0034]更新模块,用于更新站点的状态和所述车辆的剩余容量;
[0035]第一判断模块,用于若站点状态及所述车辆的剩余容量更新后,可访问站点的集合不为空,则返回所述调度模块;若否,将仓库作为所述车辆的下一目的地;
[0036]处理模块,用于在所述车辆回到仓库时,根据所述车辆从仓库出发时的装载量在子路径中每一步收缩的取值范围确定所述车辆从仓库出发时装载的货物量,所述子路径为所述车辆从仓库出发然后首次回到仓库所经过的路径;...

【技术保护点】

【技术特征摘要】
1.一种车辆路径规划方法,其特征在于,用于规划车辆访问多站点的路径和车辆从仓库出发时的装载量,所述多站点包括待派送站点和待捡收站点,所述方法包括:调度步骤,利用预先训练的策略模型计算可访问站点的备选概率值,所述策略模型的输入包括每个站点的嵌入表征向量和全局表征向量,输出为每个站点的备选概率值;将备选概率值最大的站点分配给所述车辆,作为所述车辆的备选目的地;更新步骤,更新站点的状态和所述车辆的剩余容量;第一判断步骤,若站点状态及所述车辆的剩余容量更新后,可访问站点的集合不为空,则重复调度步骤;若否,将仓库作为所述车辆的下一目的地;处理步骤,在所述车辆回到仓库时,根据所述车辆从仓库出发时的装载量在子路径中每一步收缩的取值范围确定所述车辆从仓库出发时装载的货物量,所述子路径为所述车辆从仓库出发然后首次回到仓库所经过的路径;第二判断步骤,判断是否存在未被访问的站点,若存在未被访问的站点,返回所述调度步骤,若不存在未被访问的站点,转向策略输出步骤;所述策略输出步骤,根据为所述车辆分配的站点输出路径规划策略,所述路径规划策略包括所述车辆访问站点的顺序。2.根据权利要求1所述的车辆路径规划方法,其特征在于,还包括训练策略模型的步骤,训练策略模型的步骤包括:第一步骤,建立初始模型和参照模型,所述初始模型和参照模型的输入均为多个站点的位置、每个站点待投递的货物数量、每个站点待拾取的货物数量、车辆的容量,输出为每一站点的备选概率值;第二步骤,分E次迭代,每次迭代中依次加载N批训练数据,每批训练数据包含B组训练数据,每组训练数据包括多个站点的位置、每个站点待投递的货物数量、每个站点待拾取的货物数量、车辆的容量,E,N,B均为大于1的整数;第三步骤,在第j次迭代中,利用第i批B组训练数据和所述初始模型得到第i批B组训练数据中各组训练数据对应的路径规划策略的备选概率值分布pi,并根据所述路径规划策略计算第i批B组训练数据的第一损失值,j,i的初始值为1;第四步骤,在第j次迭代中,利用第i批B组训练数据和所述参照模型得到第i批B组训练数据中各组训练数据对应的路径规划策略,并根据所述路径规划策略计算第i批B组训练数据的第二损失值,j,i的取值同第三步骤;第五步骤,在第j次迭代中,利用第i批B组训练数据对应的所述第一损失值,第二损失值与路径规划策略的备选概率值分布pi,更新初始模型参数;第六步骤,判断i的值是否等于N,若是,转向第七步骤,若否,将i的值加1,转向第三步骤;第七步骤,利用验证集数据和更新后的初始模型得到所述验证集数据对应的初始模型策略,利用所述验证集数据和所述参照模型得到所述验证集数据对应的参照模型策略,并计算所述初始模型策略对应的备选概率值分布和所述参照模型策略对应的备选概率值分布的成对t检验结果;第八步骤,若上述成对t检验结果小于预设阈值,将所述参照模型更新为与更新后的初始模型一致,若所述成对t检验结果不小于预设阈值,不更新所述参照模型;
第九步骤,判断j的值是否等于E,若是,转向第十步骤,若否,将j的值加1,i的值置为0,转向第三步骤;第十...

【专利技术属性】
技术研发人员:李勇陈锦炜宗泽方庄云麟郑萌耿璐
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1