车辆用控制装置、车辆用控制系统以及车辆用学习装置制造方法及图纸

技术编号：32507015 阅读：13 留言：0更新日期：2022-03-02 10:30

本发明专利技术公开车辆用控制装置、车辆用控制系统以及车辆用学习装置。车辆用控制装置具备：存储装置，存储作为用于规定车辆的状态与行动变量的关系的数据的关系规定数据；以及执行装置，构成为如下：获取所述状态，根据所述行动变量的值来操作驱动系统装置，在基于所述状态的所述驱动系统装置的状态满足预定的基准的情况下以变大的方式计算报酬，使用更新映射来进行所述关系规定数据的更新，在所述驱动系统装置的驱动受到预定的制约的情况下，以使所述关系规定数据的更新量变小的方式，限制所述关系规定数据的更新。规定数据的更新。规定数据的更新。

全部详细技术资料下载

【技术实现步骤摘要】
车辆用控制装置、车辆用控制系统以及车辆用学习装置

[0001]本专利技术涉及车辆用控制装置、车辆用控制系统以及车辆用学习装置。

技术介绍

[0002]例如在下述日本特开2000
‑
250602中，记载有通过强化学习来决定与车辆的状态相应的适当的变速比。

技术实现思路

[0003]然而，在对调整上述变速比的变速装置的驱动存在制约的情况下，当反复进行强化学习时，学习结果有可能会从对变速装置的驱动没有制约的情况下的适当的值大幅偏离。这样的情形不限于在变速装置中产生，可能在驱动系统装置中产生。
[0004]本专利技术的第一方式提供一种车辆用控制装置，具备：存储装置，存储关系规定数据，该关系规定数据是用于规定车辆的状态与作为与搭载于所述车辆的驱动系统装置的操作有关的变量的行动变量的关系的数据；以及执行装置，构成为如下：根据车载传感器的检测值来获取所述状态，基于根据被所述执行装置获取到的所述状态和所述关系规定数据确定的所述行动变量的值，操作所述驱动系统装置，以在基于被所述执行装置获取到的所述状态的所述驱动系统装置的状态满足预定的基准的情况下比基于被所述执行装置获取到的所述状态的所述驱动系统装置的状态不满足预定的基准的情况大的方式计算报酬，使用预先决定的更新映射来进行所述关系规定数据的更新，该预先决定的更新映射将被所述执行装置获取到的所述状态、在所述驱动系统装置的操作中利用的所述行动变量的值以及与所述操作对应的所述报酬作为自变量，返回以使在依照所述关系规定数据操作所述驱动系统装置的情况下计...

【技术保护点】

【技术特征摘要】
1.一种车辆用控制装置，其特征在于，具备：存储装置，存储关系规定数据，该关系规定数据是用于规定车辆的状态与行动变量的关系的数据，所述行动变量是与搭载于所述车辆的驱动系统装置的操作有关的变量；以及执行装置，构成为如下：根据车载传感器的检测值来获取所述状态，基于根据被所述执行装置获取到的所述状态和所述关系规定数据确定的所述行动变量的值，操作所述驱动系统装置，以在基于被所述执行装置获取到的所述状态的所述驱动系统装置的状态满足预定的基准的情况下比基于被所述执行装置获取到的所述状态的所述驱动系统装置的状态不满足预定的基准的情况大的方式计算报酬，使用预先决定的更新映射来进行所述关系规定数据的更新，该预先决定的更新映射将被所述执行装置获取到的所述状态、在所述驱动系统装置的操作中利用的所述行动变量的值以及与所述操作对应的所述报酬作为自变量，返回以使在依照所述关系规定数据操作所述驱动系统装置的情况下计算的关于所述报酬的期待收益增加的方式更新后的所述关系规定数据，并且，在所述驱动系统装置的驱动受到预定的制约的情况下，以使所述关系规定数据的更新量比所述驱动系统装置的驱动不受到所述预定的制约的情况小的方式，限制所述关系规定数据的更新。2.根据权利要求1所述的车辆用控制装置，其特征在于，所述执行装置构成为判定在所述驱动系统装置中是否存在异常，在所述执行装置判定为在所述驱动系统装置中存在异常的情况下，所述驱动系统装置的驱动受到所述预定的制约。3.根据权利要求1或者2所述的车辆用控制装置，其特征在于，所述驱动系统装置包括变速装置，在所述变速装置的工作油的温度为高温阈值以上的情况下，所述驱动系统装置的驱动受到所述预定的制约。4.根据权利要求1～3中的任意一项所述的车辆用控制装置，其特征在于，所述驱动系统装置包括变速装置，在所述变速装置的工作油的温度为低温阈值以下的情况下，所述驱动系统装置的驱动受到所述预定的制约。5.根据权利...

【专利技术属性】
技术研发人员：樗泽英明，田端淳，奥田弘一，今村健，藤井广太，佐佐木启太，
申请(专利权)人：丰田自动车株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人