旅程规划模型的训练方法和旅程规划方法技术

技术编号:34732291 阅读:24 留言:0更新日期:2022-08-31 18:21
本公开提供了一种旅程规划模型的训练方法、旅程规划方法、装置、设备、存储介质以及计算机程序产品,涉及人工智能技术领域,具体为深度学习技术领域,可应用于旅程规划等场景。具体实现方案为:获取训练样本集,其中,训练样本包括旅程请求样本和对应的目标旅程样本;执行以下训练步骤:从训练样本集中选取一对旅程请求样本和目标旅程样本;基于选取的目标旅程样本和旅程请求样本中的时间预算信息,对初始旅程规划模型进行训练,得到训练后的旅程规划模型;响应于训练次数满足第一次数阈值条件,将训练后的旅程规划模型确定为目标旅程规划模型。提高了旅程规划的效率。提高了旅程规划的效率。提高了旅程规划的效率。

【技术实现步骤摘要】
旅程规划模型的训练方法和旅程规划方法


[0001]本公开涉及人工智能
,具体为深度学习
,可应用于旅程规划等场景,尤其涉及一种旅程规划模型的训练方法、旅程规划方法、装置、设备、存储介质以及计算机程序产品。

技术介绍

[0002]目前在进行旅程规划时,通常将旅程规划问题转化为一个整数规划问题进行求解,或者不考虑时间预算信息,基于循环神经网络来生成一个旅程,但基于整数规划问题的规划方法规划结果不一定合理,且求解过程耗时严重,基于循环神经网络的方法不考虑时间预算信息,规划结果不够个性化。

技术实现思路

[0003]本公开提供了一种旅程规划模型的训练方法、旅程规划方法、装置、设备、存储介质以及计算机程序产品,提高了旅程规划的效率。
[0004]根据本公开的一方面,提供了一种旅程规划模型的训练方法,包括:获取训练样本集,其中,训练样本包括旅程请求样本和对应的目标旅程样本;执行以下训练步骤:从训练样本集中选取一对旅程请求样本和目标旅程样本;基于选取的目标旅程样本和旅程请求样本中的时间预算信息,对初始旅程规划模型进行训练,得到训练后的旅程规划模型;响应于训练次数满足第一次数阈值条件,将训练后的旅程规划模型确定为目标旅程规划模型。
[0005]根据本公开的另一方面,提供了一种旅程规划方法,包括:获取旅程请求,旅程请求包括时间预算信息和出发地信息;将旅程请求输入到目标旅程规划模型中,得到目标旅程。
[0006]根据本公开的又一方面,提供了一种旅程规划模型的训练装置,包括:获取模块,被配置为获取训练样本集,其中,训练样本包括旅程请求样本和对应的目标旅程样本;训练模块,被配置为执行以下训练步骤:从训练样本集中选取一对旅程请求样本和目标旅程样本;基于选取的目标旅程样本和旅程请求样本中的时间预算信息,对初始旅程规划模型进行训练,得到训练后的旅程规划模型;响应于训练次数满足第一次数阈值条件,将训练后的旅程规划模型确定为目标旅程规划模型。
[0007]根据本公开的又一方面,提供了一种旅程规划装置,包括:获取请求模块,被配置为获取旅程请求,旅程请求包括时间预算信息和出发地信息;规划模块,被配置为将旅程请求输入到目标旅程规划模型中,得到目标旅程
[0008]根据本公开的又一方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被上述至少一个处理器执行,以使上述至少一个处理器能够执行上述旅程规划模型的训练方法及旅程规划方法。
[0009]根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储
介质,其中,上述计算机指令用于使上述计算机执行上述旅程规划模型的训练方法及旅程规划方法。
[0010]根据本公开的再一方面,提供了一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现上述旅程规划模型的训练方法及旅程规划方法。
[0011]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0012]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0013]图1是本公开可以应用于其中的示例性系统架构图;
[0014]图2是根据本公开的旅程规划模型的训练方法的一个实施例的流程图;
[0015]图3是根据本公开的旅程规划模型的训练方法的另一个实施例的流程图;
[0016]图4是根据本公开的旅程规划模型的训练方法的一个示意图;
[0017]图5是根据本公开的旅程规划方法的一个实施例的流程图;
[0018]图6是根据本公开的旅程规划模型的训练装置的一个实施例的结构示意图;
[0019]图7是根据本公开的旅程规划装置的一个实施例的结构示意图;
[0020]图8是用来实现本公开实施例的旅程规划模型的训练方法或旅程规划方法的电子设备的框图。
具体实施方式
[0021]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0022]图1示出了可以应用本公开的旅程规划模型的训练方法或旅程规划方法或旅程规划模型的训练装置或旅程规划装置的实施例的示例性系统架构100。
[0023]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0024]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以获取目标旅程规划模型或旅程规划结果等。终端设备101、102、103上可以安装有各种客户端应用,例如样本获取应用等等。
[0025]终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述电子设备中。其可以实现成多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
[0026]服务器105可以提供各种基于确定目标旅程规划模型或旅程规划结果的服务。例如,服务器105可以对从终端设备101、102、103获取到的旅程规划请求进行分析和处理,并生成处理结果(例如确定出时间预算信息和出发地信息等)。
[0027]需要说明的是,服务器105可以是硬件,也可以是软件。当服务器105为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器105为软件时,可以实现成多个软件或软件模块(例如用来提供分布式服务),也可以实现成单个软件或软件模块。在此不做具体限定。
[0028]需要说明的是,本公开实施例所提供的旅程规划模型的训练方法或旅程规划方法一般由服务器105执行,相应地,旅程规划模型的训练装置或旅程规划装置一般设置于服务器105中。
[0029]应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
[0030]继续参考图2,其示出了根据本公开的旅程规划模型的训练方法的一个实施例的流程200。该旅程规划模型的训练方法包括以下步骤:
[0031]步骤201、获取训练样本集,其中,训练样本包括旅程请求样本和对应的目标旅程样本。
[0032]在本实施例中,旅程规划模型的训练方法的执行主体(例如本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种旅程规划模型的训练方法,包括:获取训练样本集,其中,训练样本包括旅程请求样本和对应的目标旅程样本;执行以下训练步骤:从所述训练样本集中选取一对旅程请求样本和目标旅程样本;基于选取的目标旅程样本和旅程请求样本中的时间预算信息,对初始旅程规划模型进行训练,得到训练后的旅程规划模型;响应于训练次数满足第一次数阈值条件,将所述训练后的旅程规划模型确定为目标旅程规划模型。2.根据权利要求1所述的方法,还包括:响应于所述训练次数不满足所述第一次数阈值条件,将所述训练后的旅程规划模型作为所述初始旅程规划模型,再次执行所述训练步骤。3.根据权利要求2所述的方法,其中,所述基于选取的目标旅程样本和旅程请求样本中的时间预算信息,对初始旅程规划模型进行训练,得到训练后的旅程规划模型包括:获取选取的旅程请求样本中的所述时间预算信息、出发地信息;基于所述初始旅程规划模型对所述时间预算信息、所述出发地信息以及预先确定的多个候选地点信息进行联合计算,从所述多个候选地点信息中选出至少一个目标地点信息,并与所述出发地信息组成初始旅程信息;基于所述初始旅程信息和选取的目标旅程样本计算得到损失值,基于所述损失值对所述初始旅程规划模型进行参数调整,得到所述训练后的旅程规划模型。4.根据权利要求3所述的方法,其中,所述初始旅程规划模型包括预处理层、注意力层、前馈网络层和规划层;所述基于所述初始旅程规划模型对所述时间预算信息、所述出发地信息以及预先确定的多个候选地点信息进行联合计算,从所述多个候选地点信息中选出至少一个目标地点信息包括:通过所述预处理层对所述多个候选地点信息进行预处理,得到第一向量矩阵;将所述第一向量矩阵输入到所述注意力层中进行计算,得到第二向量矩阵;将所述第二向量矩阵输入到所述前馈网络层中进行计算,得到候选向量矩阵;通过所述规划层对所述候选向量矩阵、所述时间预算信息和所述出发地信息进行联合计算,并基于计算结果从所述多个候选地点信息中选出至少一个目标地点信息。5.根据权利要求4所述的方法,其中,所述通过所述预处理层对所述多个候选地点信息进行预处理,得到第一向量矩阵包括:基于所述预处理层执行如下操作:将所述多个候选地点信息转换为对应的多个向量组,每个向量组中包括坐标嵌入向量、类别嵌入向量和停留时间嵌入向量;将同一组的坐标嵌入向量、类别嵌入向量和停留时间嵌入向量,拼接为一个第一表征向量;将得到的多个第一表征向量确定为所述第一向量矩阵。6.根据权利要求5所述的方法,其中,所述将所述第一向量矩阵输入到所述注意力层中进行计算,得到第二向量矩阵包括:通过所述注意力层中的多个注意力头,对输入的所述第一向量矩阵进行计算,得到多个注意力头矩阵;
将所述多个注意力头矩阵进行拼接,得到所述第二向量矩阵。7.根据权利要求6所述的方法,其中,所述将所述第二向量矩阵输入到所述前馈网络层中进行计算,得到候选向量矩阵包括:通过所述前馈网络层中的多个前馈网络子层,对输入的所述第二向量矩阵进行非线性变换,得到所述候选向量矩阵。8.根据权利要求7所述的方法,其中,所述通过所述规划层对所述候选向量矩阵、所述时间预算信息和所述出发地信息进行联合计算,并基于计算结果从所述多个候选地点信息中选出至少一个目标地点信息包括:基于所述规划层执行以下操作:对所述候选向量矩阵、所述时间预算信息和所述出发地信息进行联合计算,生成一个上下文向量,其中,所述上下文向量包括可用时间;基于所述上下文向量从所述多个候选地点信息中选出一个目标地点信息;响应于所述可用时间不满足时间阈值条件,再次执行所述对所述候选向量矩阵、所述时间预算信息和所述出发地信息进行联合计算。9.根据权利要求8所述的方法,其中,所述对所述候选向量矩阵、所述时间预算信息和所述出发地信息进行联合计算,生成一个上下文向量包括:对所述候选向量矩阵进行拆分计算,生成全局表征向量;对所述候选向量矩阵、所述时间预算信息和所述出发地信息进行联合计算,得到所述可用时间,并将所述可用时间转换为可用时间嵌入向量;从所述候选向量矩阵中获取最后被选中的目标地点信息的表征向量;将所述全局表征向量、所述可用时间嵌入向量和所述最后被选中的目标地点信息的表征向量,拼接为所述上下文向量。10.根据权利要求9所述的方法,其中,所述基于所述上下文向量从所述多个候选地点信息中选出一个目标地点信息包括:对所述上下文向量执行时间掩码操作,得到改进的上下文向量;基于所述改进的上下文向量计算选择每个候选地点信息的概率;将概率最大的候选地点信息确定为所述目标地点信息。11.根据权利要求1

10任一项所述的方法,其中,所述响应于训练次数满足第一次数阈值条件,将所述训练后的旅程规划模型确定为目标旅程规划模型包括:响应于所述训练次数满足所述第一次数阈值条件且不满足第二次数阈值条件,基于策略梯度算法对所述训练后的旅程规划模型进行参数调整,得到优化后的旅程规划模型,并将所述优化后的旅程规划模型作为所述训练后的旅程规划模型,再次执行所述基于策略梯度算法对所述训练后的旅程规划模型进行参数调整;响应于所述训练次数满足所述第二次数阈值条件,将所述优化后的旅程规划模型确定为所述目标旅程规划模型;其中,所述第一次数阈值条件的数值小于所述第二次数阈值条件的数值。12.一种旅程规划方法,包括:获取旅程请求,所述旅程请求包括时间预算信息和出发地信息;将所述旅程请求输入到目标旅程规划模型中,得到目标旅程,其中,所述目标旅程规划
模型基于权利要求1

11任一项所述的训练方法训练得到。13.一种旅程规划模型的训练装置,所述装置包括:获取模块,被配置为获取训练样本集,其中,训练样本包括旅程请求样本和对应的目标旅程样本;训练模块,被配置为执行以下训练步骤:从所述训练样本集中选取一对旅程请求样本和目标旅程样本;基于选取的目标旅程样本和旅程请求...

【专利技术属性】
技术研发人员:江林朗周景博徐童李岩岩陈浩窦德景
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1