具有驾驶激进性的期望水平的自动化驾驶系统技术方案

技术编号：38014972 阅读：27 留言：0更新日期：2023-06-30 10:39

本发明专利技术涉及具有驾驶激进性的期望水平的自动化驾驶系统。一种系统包括计算机，该计算机包括处理器和存储器。存储器包括指令，使得处理器被编程为：接收表示感知的驾驶环境的传感器数据；基于使用传感器数据所计算的挑战分数和期望的驾驶风格，从多个强化学习智能体中选择强化学习智能体；以及基于传感器数据经由选择的强化学习智能体来生成驾驶动作。选择的强化学习智能体来生成驾驶动作。选择的强化学习智能体来生成驾驶动作。

全部详细技术资料下载

【技术实现步骤摘要】
具有驾驶激进性的期望水平的自动化驾驶系统

[0001]本公开涉及基于感测的驾驶环境和用户偏好来选择强化学习智能体以操作车辆。

技术介绍

[0002]强化学习系统包括智能体，该智能体通过执行由强化学习系统响应于接收到表征环境的当前状态的观察结果所选择的动作来与环境交互。

技术实现思路

[0003]一种系统包括计算机，该计算机包括处理器和存储器。存储器包括指令，使得处理器被编程为：接收表示感知的驾驶环境的传感器数据；基于使用传感器数据所计算的挑战分数和期望的驾驶风格，从多个强化学习智能体中选择强化学习智能体；以及基于传感器数据经由选择的强化学习智能体来生成驾驶动作。
[0004]在其他特征中，所述多个强化学习智能体中的每个强化学习智能体对应于不同的挑战分数和期望的驾驶风格。
[0005]在其他特征中，期望的驾驶风格对应于驾驶激进性的期望水平。
[0006]在其他特征中，驾驶激进性的期望水平对应于在特定的时间段内完成驾驶动作。
[0007]在其他特征中，所述多个强化学习智能体包括M
×
N个强化学习智能体，其中，M是表示M个驾驶偏好水平的整数，且N是表示N个数量的驾驶环境的整数。
[0008]在其他特征中，处理器进一步被编程为基于表示不同的感知的驾驶环境的传感器数据从所述多个强化学习智能体中自动选择另一个强化学习智能体。
[0009]在其他特征中，期望的驾驶风格是从用户接收的。
[0010]在其他特征中，期望的驾驶风格是从人机接口（HM...

【技术保护点】

【技术特征摘要】
1.一种系统，其包括计算机，所述计算机包括处理器和存储器，所述存储器包括指令，使得所述处理器被编程为：接收表示感知的驾驶环境的传感器数据；基于使用所述传感器数据所计算的挑战分数和期望的驾驶风格，从多个强化学习智能体中选择强化学习智能体；以及基于所述传感器数据经由选择的强化学习智能体来生成驾驶动作。2.根据权利要求1所述的系统，其中，所述多个强化学习智能体中的每个强化学习智能体对应于不同的挑战分数和期望的驾驶风格。3.根据权利要求1所述的系统，其中，所述期望的驾驶风格对应于驾驶激进性的期望水平。4.根据权利要求1所述的系统，其中，驾驶激进性的所述期望水平对应于在特定的时间段内完成所述驾驶动作。5.根据权利要求1所述的系统，其中，所...

【专利技术属性】
技术研发人员：A，
申请(专利权)人：通用汽车环球科技运作有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人