System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能(artificial intelligence,ai),尤其涉及一种车辆换道决策方法、装置和存储介质。
技术介绍
1、ai是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。自动驾驶是人工智能领域的一种主流应用,自动驾驶技术依靠计算机视觉、雷达、监控装置和全球定位系统等协同合作,让机动车辆可以在不需要人类主动操作下,实现自动驾驶。因此,自动驾驶技术越来越受到重视。
2、在自动驾驶领域中,自动驾驶车辆的换道决策设计还面临巨大的挑战。车辆的横向换道决策指的是车辆根据当前环境状态进行车道保持、左换道、右换道的行为,属于自动驾驶场景下的基本决策行为。当前的车辆换道决策方法主要包括基于规则的方法和基于强化学习的方法。基于规则的决策方法需要依赖大量的专家知识进行人工设计,由于存在大量参数的耦合,这类方法难以在不同的动态交通场景下做出长远的最优决策。而现有的基于强化学习的换道决策方法在简单的场景中通常具有较好的决策效果,但是在真实的动态交通场景中,强化学习换道模型效果不够稳定,难以保证最优。同时,现有的基于强化学习的换道方法的应用场景有限,难以高效地解决车辆在动态交通环境、复杂道路拓扑下的换道决策问题。因此,亟需一种新型的车辆换道决策方法。
技术实现思路
1、有鉴于此,提出了一种车辆换道决策方法、装置和存储介质。
2、第一方面,本申请的实施例提供了一种车辆换道决策方法。
3、确定目标车辆的第一状态数据和目标车辆周围的障碍物的第二状态数据,目标车辆周围的障碍物包括目标车辆周围的其他车辆和用于表示道路信息的虚拟障碍物;
4、将第一状态数据和第二状态数据输入神经网络模型,输出关于目标车辆的换道决策结果,换道决策结果包括使目标车辆执行向左换道、向右换道、保持当前车道中任一种的换道动作。
5、根据本申请实施例,通过以虚拟障碍物来表征道路信息,将虚拟障碍物的状态数据输入神经网络模型,能够归一化地考虑到道路拓扑的影响,通过将目标车辆周围的其他车辆的状态数据输入模型,能够考虑到动态交通环境下其他车辆的影响,本申请的方法通过第二状态数据进行完整的环境表征,将道路信息与障碍物信息归一化,有利于提高模型的泛化能力,由此,通过将目标车辆的第一状态数据和障碍物的第二状态数据输入神经网络模型,输出的目标车辆的换道决策结果更加贴合实际、更加精准。该方法可以应用于车载终端设备,从而能够在车端实时提供换道决策结果,在复杂的实际道路环境中能够始终进行有效地换道决策,在提升车辆行驶效率的同时,充分保证安全性。
6、根据第一方面,在车辆换道决策方法的第一种可能的实现方式中,道路信息包括道路拓扑信息、车道限速信息和限制换道信息,虚拟障碍物包括基于道路拓扑信息设置的第一虚拟障碍物、基于车道限速信息设置的第二虚拟障碍物和基于限制换道信息设置的第三虚拟障碍物。
7、根据本申请实施例,可以基于不同的道路信息的类型分别设置不同的虚拟障碍物,从而可以利用虚拟障碍物灵活地表示不同的道路情况,以达到不同的限制行驶目的。基于此,在复杂的道路场景下,也可以利用虚拟障碍物进行准确地表征,大大地拓宽了模型的应用场景,提升了换道决策的准确度。
8、根据第一方面的第一种可能的实现方式,在车辆换道决策方法的第二种可能的实现方式中,第一虚拟障碍物的速度为0,设置于车道终止或合并的位置;第二虚拟障碍物的速度为存在限速的车道的限制车速,设置于存在限速的车道上距目标车辆预定距离的位置;第三虚拟障碍物的速度为目标车辆的车速,设置于限制换入的车道上与目标车辆平行的位置。
9、根据本申请实施例,通过针对不同的道路情况,分别设置相应虚拟障碍物的速度和位置,使方案可以灵活应用不同的道路场景中,且可以使这些虚拟障碍物与目标车辆周围的其他车辆实现归一化的表征,从而,后续在进行换道决策时,可以针对各种道路场景得到的更加科学的决策结果。
10、根据第一方面的第二种可能的实现方式,在车辆换道决策方法的第三种可能的实现方式中,预定距离为目标车辆的传感器或人眼可感知的最大距离。
11、根据本申请实施例,可以更加真实的模拟实际车辆行驶的过程,以在自动驾驶的过程中更加科学地考虑到车道限速,达到更好的换道效果。
12、根据第一方面或第一方面的第一种或第二种或第三种可能的实现方式,在车辆换道决策方法的第四种可能的实现方式中,目标车辆周围的障碍物包括目标车辆所在车道、目标车辆所在车道的左侧车道和右侧车道上目标车辆周围的障碍物。
13、根据本申请实施例,通过选取目标车辆所在车道、所在车道的左侧车道和右侧车道上的障碍物,可以使得在进行换道决策的过程中高效且尽可能全面的考虑到目标车辆周围的障碍物,以得到更加准确的换道决策结果。
14、根据第一方面或第一方面的第一种或第二种或第三种或第四种可能的实现方式,在车辆换道决策方法的第五种可能的实现方式中,第二状态数据包括目标车辆所在车道上和目标车辆所在车道的左侧车道上的障碍物的第三状态数据,以及目标车辆所在车道上和目标车辆所在车道的右侧车道上的障碍物的第四状态数据,将第一状态数据和第二状态数据输入神经网络模型,输出关于目标车辆的换道决策结果,包括:
15、神经网络模型基于第一状态数据和第三状态数据,确定第一组评价值,第一组评价值包括向左换道的动作的评价值和保持当前车道的动作的评价值;
16、神经网络模型基于第一状态数据和第四状态数据,确定第二组评价值,第二组评价值包括向右换道的动作的评价值和保持当前车道的动作的评价值;
17、神经网络模型基于第一组评价值和第二组评价值,输出换道决策结果。
18、根据本申请实施例,通过将第二状态数据分为目标车辆所在车道上和目标车辆所在车道的左侧车道上的障碍物的第三状态数据,以及目标车辆所在车道上和目标车辆所在车道的右侧车道上的障碍物的第四状态数据,以基于第一状态数据和第三状态数据、第一状态数据和第四状态数据这两组数据分别确定相应的两组评价值,可以实现对称式地评价向左换道和向右换道的动作,这种对称输入共享参数网络的构造方式可以显著缩小神经网络模型的整体规模,去除模型中的冗余结构,优化了模型的决策过程。
19、根据第一方面的第五种可能的实现方式,在车辆换道决策方法的第六种可能的实现方式中,神经网络模型基于第一状态数据和第三状态数据,确定第一组评价值,包括:
20、神经网络模型对第三状态数据进行特征提取,确定第一特征向量;
21、神经网络模型基于第一状态数据和第一特征向量,确定第一组评价值;
22、神经网络模型基于第一状态数据和第四状态数据,确定第二组评价值,包括:
23、神经网络模型对第四状态数据进行特征提取,确定第二特征向量;
24、神经网络模型基于第一状态数据和第二特征向本文档来自技高网...
【技术保护点】
1.一种车辆换道决策方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述道路信息包括道路拓扑信息、车道限速信息和限制换道信息,所述虚拟障碍物包括基于所述道路拓扑信息设置的第一虚拟障碍物、基于所述车道限速信息设置的第二虚拟障碍物和基于所述限制换道信息设置的第三虚拟障碍物。
3.根据权利要求2所述的方法,其特征在于,所述第一虚拟障碍物的速度为0,设置于车道终止或合并的位置;所述第二虚拟障碍物的速度为存在限速的车道的限制车速,设置于所述存在限速的车道上距所述目标车辆预定距离的位置;所述第三虚拟障碍物的速度为所述目标车辆的车速,设置于限制换入的车道上与所述目标车辆平行的位置。
4.根据权利要求3所述的方法,其特征在于,所述预定距离为所述目标车辆的传感器或人眼可感知的最大距离。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述目标车辆周围的障碍物包括目标车辆所在车道、目标车辆所在车道的左侧车道和右侧车道上目标车辆周围的障碍物。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第二状态数据
7.根据权利要求6所述的方法,其特征在于,所述神经网络模型基于所述第一状态数据和所述第三状态数据,确定第一组评价值,包括:
8.根据权利要求1-7任一项所述的方法,其特征在于,所述神经网络模型为训练好的神经网络模型,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述换道过程包括车辆的换道策略被成功执行时的车辆换道过程和车辆的换道策略未被执行时的车道保持过程。
10.根据权利要求8或9所述的方法,其特征在于,在车辆的换道策略被成功执行时,所述换道过程的奖励值基于车辆在换道前与前车之间的距离、速度差,以及车辆在换道后与前车之间的距离、速度差确定;在车辆的换道策略未被执行时,所述换道过程的奖励值为负值。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述状态数据包括位置、速度、加速度中的任一项或多项。
12.一种车辆换道决策装置,其特征在于,所述装置包括:
13.根据权利要求12所述的装置,其特征在于,所述道路信息包括道路拓扑信息、车道限速信息和限制换道信息,所述虚拟障碍物包括基于所述道路拓扑信息设置的第一虚拟障碍物、基于所述车道限速信息设置的第二虚拟障碍物和基于所述限制换道信息设置的第三虚拟障碍物。
14.根据权利要求13所述的装置,其特征在于,所述第一虚拟障碍物的速度为0,设置于车道终止或合并的位置;所述第二虚拟障碍物的速度为存在限速的车道的限制车速,设置于所述存在限速的车道上距所述目标车辆预定距离的位置;所述第三虚拟障碍物的速度为所述目标车辆的车速,设置于限制换入的车道上与所述目标车辆平行的位置。
15.根据权利要求14所述的装置,其特征在于,所述预定距离为所述目标车辆的传感器或人眼可感知的最大距离。
16.根据权利要求12-15任一项所述的装置,其特征在于,所述目标车辆周围的障碍物包括目标车辆所在车道、目标车辆所在车道的左侧车道和右侧车道上目标车辆周围的障碍物。
17.根据权利要求12-16任一项所述的装置,其特征在于,所述第二状态数据包括目标车辆所在车道上和目标车辆所在车道的左侧车道上的障碍物的第三状态数据,以及目标车辆所在车道上和目标车辆所在车道的右侧车道上的障碍物的第四状态数据,所述输出模块,用于:
18.根据权利要求17所述的装置,其特征在于,所述神经网络模型基于所述第一状态数据和所述第三状态数据,确定第一组评价值,包括:
19.根据权利要求12-18任一项所述的装置,其特征在于,所述神经网络模型为训练好的神经网络模型,所述装置还包括:
20.根据权利要求19所述的装置,其特征在于,所述换道过程包括车辆的换道策略被成功执行时的车辆换道过程和车辆的换道策略未被执行时的车道保持过程。
21.根据权利要求19或20所述的装置,其特征在于,在车辆的换道策略被成功执行时,所述换道过程的奖励值基于车辆在换道前与前车之间的距离、速度差,以及车辆在换道后与前车之间的距离、速度差确定;在车辆的换道策略未被执行时,所述换道过程的奖励值为负值。
22.根据权利要求12-21任一项所述的装置,其特征在于...
【技术特征摘要】
1.一种车辆换道决策方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述道路信息包括道路拓扑信息、车道限速信息和限制换道信息,所述虚拟障碍物包括基于所述道路拓扑信息设置的第一虚拟障碍物、基于所述车道限速信息设置的第二虚拟障碍物和基于所述限制换道信息设置的第三虚拟障碍物。
3.根据权利要求2所述的方法,其特征在于,所述第一虚拟障碍物的速度为0,设置于车道终止或合并的位置;所述第二虚拟障碍物的速度为存在限速的车道的限制车速,设置于所述存在限速的车道上距所述目标车辆预定距离的位置;所述第三虚拟障碍物的速度为所述目标车辆的车速,设置于限制换入的车道上与所述目标车辆平行的位置。
4.根据权利要求3所述的方法,其特征在于,所述预定距离为所述目标车辆的传感器或人眼可感知的最大距离。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述目标车辆周围的障碍物包括目标车辆所在车道、目标车辆所在车道的左侧车道和右侧车道上目标车辆周围的障碍物。
6.根据权利要求1-5任一项所述的方法,其特征在于,所述第二状态数据包括目标车辆所在车道上和目标车辆所在车道的左侧车道上的障碍物的第三状态数据,以及目标车辆所在车道上和目标车辆所在车道的右侧车道上的障碍物的第四状态数据,所述将所述第一状态数据和所述第二状态数据输入神经网络模型,输出关于目标车辆的换道决策结果,包括:
7.根据权利要求6所述的方法,其特征在于,所述神经网络模型基于所述第一状态数据和所述第三状态数据,确定第一组评价值,包括:
8.根据权利要求1-7任一项所述的方法,其特征在于,所述神经网络模型为训练好的神经网络模型,所述方法还包括:
9.根据权利要求8所述的方法,其特征在于,所述换道过程包括车辆的换道策略被成功执行时的车辆换道过程和车辆的换道策略未被执行时的车道保持过程。
10.根据权利要求8或9所述的方法,其特征在于,在车辆的换道策略被成功执行时,所述换道过程的奖励值基于车辆在换道前与前车之间的距离、速度差,以及车辆在换道后与前车之间的距离、速度差确定;在车辆的换道策略未被执行时,所述换道过程的奖励值为负值。
11.根据权利要求1-10任一项所述的方法,其特征在于,所述状态数据包括位置、速度、加速度中的任一项或多项。
12.一种车辆换道决策装置,其特征在于,所述装置包括:
13.根据权利要求12所述的装置,其特征在于,所述道路信息包括道路拓扑信息、车道限速信息和限制换道信息,所述虚拟障碍物包括基于所述道...
【专利技术属性】
技术研发人员:李骏承,孙浩,张叶青,曹文冬,程思源,张洪波,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。