路径规划方法、装置、终端及可读存储介质制造方法及图纸

技术编号：33699780 阅读：17 留言：0更新日期：2022-06-06 08:06

本发明专利技术公开了一种路径规划方法、装置、终端及可读存储介质，所述方法包括：获取第一环境下的第一专家路径轨迹以及第二环境下的第二专家路径轨迹，对第一专家路径轨迹进行逆强化学习，得到第一权重向量，其中，第一权重向量为第一专家路径轨迹的权重，基于第一权重向量，对第二专家路径轨迹逆强化迁移学习，得到第二权重向量，其中，第二权重向量中的元素为多个路径参数各自影响第二环境下的路径规划结果的权重。与现有技术采用本地有限的专家轨迹进行路径规划策略学习相比，本发明专利技术通过迁移学习和迭代逆强化学习，克服了现有技术的路径规划策略学习效率不高的缺陷，进而提升了路径规划策略学习效率以及路径规划策略的泛化能力。力。力。

全部详细技术资料下载

【技术实现步骤摘要】
路径规划方法、装置、终端及可读存储介质

[0001]本专利技术涉及金融科技领域，尤其涉及一种路径规划方法、装置、终端及可读存储介质。

技术介绍

[0002]路径规划技术的行业痛点是在复杂环境中技术的鲁棒性，常规的机器人技术并不能很好的解决复杂场景的问题。强化学习技术被引入路径规划中，强化学习是通过自动驾驶车辆在模拟环境中反复试错，进而获得比之前技术更好鲁棒性。然而，强化学习技术十分依赖搭建的模拟环境，也就是说，模拟环境一定程度的改变都会使得路径规划的策略有变化。因此，针对模拟环境的难题，学者们又提出了利用逆强化学习，利用数学上反问题领域的技巧，利用收集到的专家行驶轨迹，得到模拟环境训练出来的路径规划策略，具有有很好的鲁棒性。
[0003]随着隐私保护法例的推广，数据流动性变差，不同公司在进行难以获取足够的专家行驶轨迹来支持其路径规划策略，从而导致路径规划策略学习效率不高，泛化能力差，路径规划不理性。
[0004]上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

[0005]本专利技术的主要目的在于提供一种路径规划方法、装置、终端及可读存储介质，旨在解决现有路径规划策略学习效率不高，泛化能力差，路径规划不理性的技术问题。
[0006]为实现上述目的，本专利技术提供一种路径规划方法，所述的路径规划方法包括以下步骤：
[0007]获取第一环境下的第一专家路径轨迹以及第二环境下的第二专家路径轨迹；
[0008]对所述第一专家路径...

【技术保护点】

【技术特征摘要】
1.一种路径规划方法，其特征在于，所述路径规划方法包括：获取第一环境下的第一专家路径轨迹以及第二环境下的第二专家路径轨迹；对所述第一专家路径轨迹进行逆强化学习，得到第一权重向量，其中，所述第一权重向量中的元素为多个路径参数各自影响第一环境下的路径规划结果为所述第一专家路径轨迹的权重；基于所述第一权重向量，对所述第二专家路径轨迹逆强化迁移学习，得到第二权重向量，其中，所述第二权重向量中的元素为所述多个路径参数各自影响所述第二环境下的路径规划结果的权重。2.如权利要求1所述的路径规划方法，其特征在于，所述基于所述第一权重向量，对所述第二专家路径轨迹逆强化迁移学习，得到第二权重向量的步骤之后，还包括：获取路径规划请求，所述路径规划请求携带有环境信息、出发地坐标和目标地坐标；根据所述路径规划请求对应的出发地坐标和目标地坐标，确定多个待选路径；若所述环境信息对应的环境为所述第二环境，则根据所述第二权重向量和所述多个待选路径对应的路径参数，确定响应所述路径规划请求的目标路径。3.如权利要求1所述的路径规划方法，其特征在于，所述基于所述第一权重向量，对所述第二专家路径轨迹逆强化迁移学习，得到第二权重向量的步骤包括：基于所述第二专家路径轨迹确定所述各个路径参数各自对应的子势能函数；利用所述第一权重向量、所述子势能函数以及所述第二专家路径轨迹进行迁移学习，得到累计势能的均值，并基于所述累计势能的均值优化所述第一权重向量；基于优化后的第一权重向量进行迭代逆强化学习，直到检测到迭代停止条件，得到所述第二权重向量。4.如权利要求3所述的路径规划方法，其特征在于，所述基于所述第二专家路径轨迹确定所述各个路径参数各自对应的子势能函数的步骤包括：基于所述第二专家路径轨迹中轨迹点对应的车辆方位参数、车辆运动角度参数计算所述轨迹点与车道边界的最小距离，并确定所述最小距离对应的边界点与所述轨迹点之间的连线相对于所述车辆运动角度参数的夹角；利用所述轨迹点对应的车辆方位参数、车辆运动角度参数、所述最小距离以及所述夹角构建所述子势能函数。5.如权利要求3所述的路径规划方法，其特征在于，所述利用所述第一权重向量、所述子势能函数以及所述第二专家路径轨迹进行迁移学习，得到累计势能的均值，并基于所述累计势能的均值优化所述第一权重向量的步骤包括：基于所述第一权重向量，在所述第二专家路径轨迹...

【专利技术属性】
技术研发人员：鞠策，高大山，
申请(专利权)人：深圳前海微众银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人