输出解释信息的自动驾驶模型、训练方法、装置和车辆制造方法及图纸

技术编号：39061921 阅读：34 留言：0更新日期：2023-10-12 19:54

本公开提供了一种输出解释信息的自动驾驶模型、模型训练方法和自动驾驶车辆，涉及计算机技术领域，尤其涉及自动驾驶和人工智能技术领域。自动驾驶模型包括决策控制层和解释层，决策控制层用于基于第一输入信息输出自动驾驶策略信息，解释层用于基于第一输入信息和自动驾驶策略信息输出针对自动驾驶策略信息的解释信息，解释信息能够表征自动驾驶策略信息的决策分类，第一输入信息与车辆的导航信息和针对车辆周围环境的感知信息相关。由此，能够向乘员提供与目标自动驾驶策略信息相关的解释信息，提升自动驾驶策略的可解释性，使得乘员能够了解当前自动驾驶策略所对应的说明或原因，从而提升用户体验。从而提升用户体验。从而提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
输出解释信息的自动驾驶模型、训练方法、装置和车辆

[0001]本公开涉及计算机
，尤其涉及自动驾驶和人工智能
，具体涉及一种输出解释信息的自动驾驶模型、自动驾驶模型的训练方法、利用自动驾驶模型实现的自动驾驶方法、自动驾驶模型的训练装置、基于自动驾驶模型的自动驾驶装置、电子设备、计算机可读存储介质、计算机程序产品和自动驾驶车辆。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]自动驾驶技术融合了识别、决策、定位、通信安全和人机交互等诸多方面的技术。通过人工智能学习能够辅助生成自动驾驶策略。
[0004]高精地图也称高精度地图，是由自动驾驶汽车使用的地图。高精地图拥有精确的车辆位置信息和丰富的道路元素数据信息，可以帮助汽车预知路面复杂信息，如坡度、曲率、航向等，从而更好地规避潜在的风险。换言之，自动驾驶技术强依赖于高精地图。
[0005]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被...

【技术保护点】

【技术特征摘要】
1.一种输出解释信息的自动驾驶模型，包括决策控制层和解释层，所述决策控制层被配置用于基于输入的第一输入信息输出目标自动驾驶策略信息，所述解释层被配置用于基于输入的所述第一输入信息和所述目标自动驾驶策略信息输出针对所述目标自动驾驶策略信息的解释信息，所述解释信息能够表征所述目标自动驾驶策略信息的决策分类，所述第一输入信息与车辆的导航信息和针对车辆周围环境的感知信息相关，所述感知信息包括针对车辆周围环境的当前感知信息和历史感知信息。2.根据权利要求1所述的模型，还包括多模态编码层，所述多模态编码层被配置用于基于输入的第二输入信息输出所述第二输入信息相对应的隐式表示，所述第二输入信息包括目标车辆的导航信息和利用传感器所获得的目标车辆周围环境的感知信息，其中，所述第一输入信息为基于所述第二输入信息相对应的隐式表示。3.根据权利要求2所述的模型，其中，所述多模态编码层和决策控制层连接组成端到端的神经网络模型，以使得所述决策控制层直接基于所述多模态编码层所输出的隐式表示来获取所述目标自动驾驶策略信息。4.根据权利要求3所述的模型，还包括：自注意力网络层，所述自注意力网络层被配置用于利用自注意力机制对输入的所述隐式表示进行处理，以得到所述第一输入信息。5.根据权利要求2所述的模型，还包括未来预测层，所述未来预测层被配置用于基于输入的所述隐式表示预测针对所述目标车辆周围环境的未来预测信息，所述第一输入信息为基于所述未来预测信息，以使得所述决策控制层直接基于所述未来预测信息来获取所述目标自动驾驶策略信息。6.根据权利要求5所述的模型，还包括：自注意力网络层，所述自注意力网络层被配置用于利用自注意力机制对输入的所述未来预测信息进行处理，以得到所述第一输入信息。7.根据权利要求1
‑
6中任一项所述的模型，其中，所述解释层的输出包括用于表示是否输出解释信息的分类标识，其中，所述解释层被配置用于响应于所述分类标识指示输出解释信息，基于输入的所述第一输入信息输出所述解释信息。8.根据权利要求1
‑
7中任一项所述的模型，其中，所述解释信息为决策分类信息。9.根据权利要求1
‑
7中任一项所述的模型，其中，所述解释信息为文本信息，所述解释层被配置用于对输入的所述第一输入信息进行解码，以获得所述解释信息。10.根据权利要求1
‑
9中任一项所述的模型，其中，所述解释层的输出还包括所述解释信息对应的输出时间。11.根据权利要求1
‑
10中任一项所述的模型，还包括评价反馈层，所述评价反馈层被配置用于基于输入的所述第一输入信息输出针对所述目标自动驾驶策略信息的评价反馈信息。12.根据权利要求11所述的模型，其中，评价反馈信息包括以下各项中的至少一者：驾驶舒适度信息、驾驶安全性信息、驾驶效率、是否文明使用行车灯、驾驶行为来源信息、是否违反交通规则信息。13.一种输出解释信息的自动驾驶模型的训练方法，所述自动驾驶模型包括决策控制层和解释层，所述方法包括：获取第一样本输入信息以及第一样本输入信息相对应的第一真实自动驾驶策略信息
和针对所述第一真实自动驾驶策略信息的第一真实解释信息，所述第一真实解释信息能够表征所述第一真实自动驾驶策略信息的决策分类；将所述第一样本输入信息输入所述决策控制层，以获取所述决策控制层所输出的第一预测自动驾驶策略信息；将所述第一样本输入信息和所述第一预测自动驾驶策略信息输入所述解释层，以获取所述解释层所输出的针对所述第一预测自动驾驶策略信息的第一预测解释信息，所述第一预测解释信息能够表征所述第一预测自动驾驶策略信息的决策分类；以及基于所述第一真实解释信息和所述第一预测解释信息、以及所述第一真实自动驾驶策略信息和第一预测自动驾驶策略信息，对所述自动驾驶模型进行调参，其中，所述第一样本输入信息与样本车辆的导航信息和针对样本车辆周围环境的感知信息相关，所述感知信息包括针对样本车辆周围环境的当前感知信息和历史感知信息。14.根据权利要求13所述的方法，其中，所述自动驾驶模型还包括多模态编码层，所述方法还包括：获取第二样本输入信息，所述第二样本输入信息包括样本车辆的导航信息和利用传感器所获得的样本车辆周围环境的感知信息；以及将所述第二样本输入信息输入所述多模态编码层，以获取所述多模态编码层所输出的所述第二样本输入信息相对应的第一样本隐式表示，其中，所述第一样本输入信息为基于所述第二样本输入信息相对应的第一样本隐式表示。15.根据权利要求14所述的方法，其中，所述多模态编码层和决策控制层连接组成端到端的神经网络模型，以使得所述决策控制层直接基于所述多模态编码层所输出的第一样本隐式表示来获取自动驾驶策略信息。16.根据权利要求15所述的方法，其中，所述自动驾驶模型还包括自注意力网络层，所述方法还包括：将所述第一样本隐式表示输入所述自注意力网络层以使得所述自注意力网络层利用自注意力机制对所述第一样本隐式表示进行处理，并获取所述自注意力网络层所输出的所述第一样本输入信息。17.根据权利要求14所述的方法，其中，所述自动驾驶模型还包括未来预测层，所述方法还包括：将所述第一样本隐式表示输入所述未来预测层，以获取所述未来预测层所输出的针对所述样本车辆周围环境的未来预测信息，所述第一样本输入信息为基于所述未来预测信息，以使得所述决策控制层直接基于所述未来预测信息来获取自动驾驶策略信息。18.根据权利要求17所述的方法，其中，所述自动驾驶模型还包括自注意力网络层，所述方法还包括：将所述未来预测信息输入所述自注意力网络层以使得所述自注意力网络层利用自注意力机制对所述未来预测信息进行处理，并获取所述自注意力网络层所输出的所述第一样本输入信息。19.根据权利要求13
‑
18中任一项所述的方法，其中，所述真实解释信息为真实决策分
类信息，并且所述预测解释信息为预测决策分类信息。20.根据权利要求13
‑
18中任一项所述的方法，其中，所述第一预测解释信息为文本信息，将所述第一样本输入信息和所...

【专利技术属性】
技术研发人员：黄际洲，王凡，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人