动力电池快充控制方法、装置、设备和存储介质制造方法及图纸

技术编号:38997838 阅读:14 留言:0更新日期:2023-10-07 10:29
本公开实施例提供一种动力电池快充控制方法、装置、设备和存储介质。动力电池快充控制方法包括:获取动力电池的实时特征参数,所述实时特征参数包括实时电芯温度和实时荷电状态,热管理部件的实时工作特性参数,以及所述动力电池所处环境的实时环境特征参数中的至少两个;采用预先训练的强化学习模型处理所述实时特征参数,生成第一快充控制指令,所述第一快充控制指令包括用于控制快充电流的第一充电电流控制指令和/或用于控制所述热管理部件的第一热管理控制指令。因为强化学习模型根据多组样本数据和对应的快充回报价值得分训练得到,所以采用本公开实施例提供的动力电池控制方法,无需为了实现电池快充的精确化控制而构建控制策略查找表,降低了动力电池设计和测试阶段的工作量。测试阶段的工作量。测试阶段的工作量。

【技术实现步骤摘要】
动力电池快充控制方法、装置、设备和存储介质


[0001]本公开涉及动力电池
,具体涉及一种动力电池快充控制方法、装置、设备和存储介质。

技术介绍

[0002]动力电池快充充电过程中,应尽可能使得充电电流较大,电芯温度维持在合理的区间范围内,并尽可能降低热管理造成的电量消耗。
[0003]相关技术中,对动力电池进行快充控制方法主要是基于规则的控制方法。采用基于规则的控制方法,需要根据动力电池的荷电状态、电芯温度、热管理系统的工作能力和环境温度,查找预先设定的控制策略查找表,确定合理的充电控制策略。充电控制策略包括充电电流大小和热管理控制策略。
[0004]但是,采用基于规则的动力电池快充控制方法,为了实现电池快充的精确化控制,需要在动力电池设计和测试阶段进行大量的测试工作,构建控制策略查找表。并且,随着动力电池电芯和热管理系统的性能退化,前述控制策略查找表可能无法与动力电池的实际特性较好地匹配,在此情况下对控制策略查找表进行合理修改的成本很高。

技术实现思路

[0005]为了解决上述技术问题,本公开提供一种动力电池快充控制方法、装置、设备和存储介质。
[0006]第一方面,本公开实施例提供一种动力电池快充控制方法,包括:
[0007]获取动力电池的实时特征参数,所述实时特征参数包括电芯温度和实时荷电状态,热管理部件的实时工作特性参数,以及所述动力电池所处环境的实时环境特征参数中的至少两个;
[0008]采用预先训练的强化学习模型处理所述实时特征参数,生成第一快充控制指令,所述第一快充控制指令包括用于控制快充电流的第一充电电流控制指令和/或用于控制所述热管理部件的第一热管理控制指令;
[0009]其中,所述强化学习模型基于多组样本数据和所述样本数据对应的快充回报价值得分训练得到,每组所述样本数据均包括样本充电电流、样本电芯温度、样本荷电状态,热管理部件的样本工作特性参数,快充过程所处环境的样本环境特征参数中的至少两个。
[0010]可选的,所述实时特征参数包括实时电芯温度;
[0011]在所述采用预先训练的强化学习模型处理所述实时特征参数之前,所述方法还包括:
[0012]判断所述实时电芯温度是否处在预设安全阈值内;
[0013]在所述实时电芯温度处在预设安全阈值内的情况下,执行所述采用预先训练的强化学习模型处理所述实时特征参数,生成第一快充控制指令的操作。
[0014]可选的,所述样本数据包括采用预先构建的电池快充物理模型进行仿真得到的仿
真数据,所述电池快充物理模型包括电芯温度子模型、荷电状态子模型和更新策略子模型,所述电芯温度子模型、所述荷电状态子模型和所述更新策略子模型基于多组历史数据综合构建,所述历史数据包括历史充电电流、历史电芯温度、历史荷电状态、热管理部件的历史工作特性参数、快充过程所处环境的历史环境特征参数中的至少两个。
[0015]可选的,所述方法还包括:
[0016]计算基于第一快充控制指令进行快充控制后的快充回报价值得分;
[0017]在预设数量的第一快充控制指令对应的快充回报价值得分小于预设分值的情况下,对所述强化学习模型进行再训练。
[0018]第二方面,本公开实施例提供一种用于动力电池快充的强化学习模型训练方法,包括:
[0019]获取样本数据,以及获取样本数据对应的快充回报价值得分,所述样本数据包括样本充电电流、样本电芯温度、样本荷电状态,热管理部件的样本工作特性参数,快充过程所处环境的样本环境特征参数中的至少两个;
[0020]采用所述样本数据和对应的所述快充回报价值得分对强化学习模型进行训练。
[0021]可选的,所述获取样本数据包括:
[0022]根据多组历史数据构建电池快充物理模型,其中所述电池快充物理模型包括电芯温度子模型、荷电状态子模型和更新策略子模型;所述历史数据包括历史充电电流、历史电芯温度、历史荷电状态、热管理部件的历史工作特性参数、快充过程所处环境的历史环境特征参数中的至少两个;
[0023]采用所述电池快充物理模型进行数据仿真,生成多组仿真数据,所述仿真数据包括仿真前电芯温度、仿真前荷电状态、仿真充电电流、热管理部件的仿真工作特性参数、仿真环境特征参数、仿真后电芯温度和仿真后荷电状态中的至少个;
[0024]采用所述仿真数据作为所述样本数据。
[0025]可选的,所述获取样本数据对应的快充回报价值得分包括:
[0026]根据所述仿真前荷电状态和所述仿真后荷电状态计算荷电状态变化值,根据所述热管理部件的仿真工作特性参数计算热管理部件的仿真能耗值;
[0027]基于预先设定的评分规则,分别确定所述荷电状态变化值、所述仿真能耗值和所述仿真后电芯温度对应的价值得分;
[0028]计算所述荷电状态变化值、所述仿真能耗值和所述仿真后电芯温度对应的价值得分之和,得到所述快充回报价值得分。
[0029]可选的,所述获取样本数据包括:
[0030]获取多组历史数据,所述历史数据包括历史充电电流、历史电芯温度、历史荷电状态、热管理部件的历史工作特性参数、历史快充过程所处环境的历史环境特征参数中的至少两个;
[0031]采用所述历史数据作为所述样本数据。
[0032]第三方面,本公开实施例提供一种动力电池快充控制装置,包括:
[0033]实时状态获取单元,用于获取动力电池实时特征参数,所述实时特征参数包括实时电芯温度和实时荷电状态,热管理部件实时工作特性参数,以及所述动力电池所处环境的实时环境特征参数中的至少两个;
[0034]控制指令生成单元,用于采用预先训练的强化学习模型处理所述实时特征参数,生成第一快充控制指令,所述第一快充控制指令包括用于控制快充电流的第一充电电流控制指令和/或用于控制所述热管理部件的第一热管理控制指令;
[0035]其中,所述强化学习模型基于多组样本数据训练和样本数据对应的快充回报价值得分训练得到,每组所述样本数据均包括样本充电电流、样本电芯温度、样本荷电状态,热管理部件的样本工作特性参数,快充过程所处环境的样本环境特征参数中的至少两个。
[0036]第四方面,本公开实施例提供一种用于动力电池快充的强化学习模型训练装置,包括:
[0037]样本获取单元,用于获取样本数据,以及获取样本数据对应的快充回报价值得分,所述样本数据包括样本充电电流、样本电芯温度、样本荷电状态,热管理部件的样本工作特性参数,快充过程所处环境的样本环境特征参数中的至少两个;
[0038]模型训练单元,用于采用所述样本数据和对应的所述快充回报价值得分对强化学习模型进行训练。
[0039]第五方面,本公开实施例提供一种计算机设备,包括:存储器和处理器,其中,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器执行时,实现如前所述的动力电池快充控制方法或者如前所述用于动力电池快充的强化学习模型训练方法。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种动力电池快充控制方法,其特征在于,包括:获取动力电池的实时特征参数,所述实时特征参数包括实时电芯温度和实时荷电状态,热管理部件的实时工作特性参数,以及所述动力电池所处环境的实时环境特征参数中的至少两个;采用预先训练的强化学习模型处理所述实时特征参数,生成第一快充控制指令,所述第一快充控制指令包括用于控制快充电流的第一充电电流控制指令和/或用于控制所述热管理部件的第一热管理控制指令;其中,所述强化学习模型基于多组样本数据和所述样本数据对应的快充回报价值得分训练得到,每组所述样本数据均包括样本充电电流、样本电芯温度、样本荷电状态,热管理部件的样本工作特性参数,快充过程所处环境的样本环境特征参数中的至少两个。2.根据权利要求1所述的方法,其特征在于,所述实时特征参数包括实时电芯温度;在所述采用预先训练的强化学习模型处理所述实时特征参数之前,所述方法还包括:判断所述实时电芯温度是否处在预设安全阈值内;在所述实时电芯温度处在预设安全阈值内的情况下,执行所述采用预先训练的强化学习模型处理所述实时特征参数,生成第一快充控制指令的操作。3.根据权利要求1或2任一项所述的方法,其特征在于,所述样本数据包括采用预先构建的电池快充物理模型进行仿真得到的仿真数据,所述电池快充物理模型包括电芯温度子模型、荷电状态子模型和更新策略子模型,所述电芯温度子模型、所述荷电状态子模型和所述更新策略子模型基于多组历史数据综合构建,所述历史数据包括历史充电电流、历史电芯温度、历史荷电状态、热管理部件的历史工作特性参数、快充过程所处环境的历史环境特征参数中的至少两个。4.根据权利要求1或2任一项所述方法,其特征在于,所述方法还包括:计算基于第一快充控制指令进行快充控制后的快充回报价值得分;在预设数量的第一快充控制指令对应的快充回报价值得分小于预设分值的情况下,对所述强化学习模型进行再训练。5.一种用于动力电池快充的强化学习模型训练方法,其特征在于,包括:获取样本数据,以及获取样本数据对应的快充回报价值得分,所述样本数据包括样本充电电流、样本电芯温度、样本荷电状态,热管理部件的样本工作特性参数,快充过程所处环境的样本环境特征参数中的至少两个;采用所述样本数据和对应的所述快充回报价值得分对强化学习模型进行训练。6.根据权利要求5所述的方法,其特征在于,所述获取样本数据包括:根据多组历史数据构建电池快充物理模型,其中所述电池快充物理模型包括电芯温度子模型、荷电状态子模型和更新策略子模型;所述历史数据包括历史充电电流、历史电芯温度、历史荷电状态、热管理部件的历史工作特性参数、快充过程所处环境的历史环境特征参数中的至少两个;采用所述电池快充物理模型进行数据仿真,生成多组仿真数据,所述仿真数据包括仿真前电芯温度、仿真前荷电状态、仿真充电电流、热管理部件的仿真工作特性参数、仿真环境特征参数、...

【专利技术属性】
技术研发人员:马春山薛剑刘凯峰张洪洋
申请(专利权)人:北京罗克维尔斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1