基于强化学习的锂离子电池低温加热与充电协同优化控制方法及系统技术方案

技术编号：43450448 阅读：16 留言：0更新日期：2024-11-27 12:52

本发明专利技术涉及基于强化学习的锂离子电池低温加热与充电协同优化控制方法及系统，包括：建立锂离子电池的电热耦合模型；初始化强化学习模型的动作空间、状态空间，初始化强化学习模型的策略网络和价值网络的网络参数；多状态感知：实时获取锂离子电池的状态信息；目标函数、奖励函数与约束设计：设置奖励函数，并设计动作和状态变量的上下限，目标包括充电速度和升温产热；根据当前状态信息，通过训练好的强化学习模型通过学习算法计算出最优的加热交流电流和充电直流电流；根据优化结果即计算出的最优的加热交流电流和充电直流电流，控制加热器和充电器工作，调整电池温度和充电速度。本发明专利技术实现了安全、高效、快速的充电效果，具有显著的应用前景和技术优势。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及基于强化学习的锂离子电池低温加热与充电协同优化控制方法及系统，属于电池管理。

技术介绍

1、锂离子电池在低温环境下实现安全快速充电是当前锂离子电池充电技术发展的主要瓶颈之一。环境温度对锂离子电池的充电性能有着显著影响，尤其在低温条件下，电池内部的化学反应速率显著降低，导致充电速度减缓；若盲目增大电流，会导致锂离子的析出，加速电池的老化和寿命衰减。在充电技术中，高效、安全和快速这三个核心指标常常存在竞争性矛盾，尤其是安全性与快速性之间的矛盾尤为突出。

2、传统的电池常温充电方法包括恒流恒压、多段恒流和恒定功率等。其中，恒流恒压法由于设计简单而被广泛应用，但其在快速充电过程中未能有效控制温升，导致安全性较差，这也是电动汽车充电起火的主要原因之一。低温下性能衰退，现有研究通常在低温充电前对电池进行预加热，将电池加热至特定温度后再进行充电。然而，这种充电策略将预加热和充电过程分为两个独立的控制环节，无法在充电阶段实现交流与直流电流的同时输出，且未能实现加热和充电控制的协同优化，限制了低温环境下的充电效率。

3、此外，传统充电方法大多以电池端电压、表面温度等宏观特性为约束，忽略了电池内部的电-热耦合机理和核心温度特性，难以实现充电速度和安全性能的综合优化。

技术实现思路

1、针对现有技术的不足，本专利技术提供了基于强化学习的锂离子电池低温加热与充电协同优化控制方法；

2、本专利技术综合考虑了电池内部核心温度状态和多物理过程的约束，提出了一种基

3、本专利技术还提供了基于强化学习的锂离子电池低温加热与充电协同优化控制系统。

4、术语解释：

5、1、soc(state of charge)，指电池当前的电荷状态，通常表示为百分比(0％至100％)。它描述了电池存储了多少能量，或者还可以提供多少能量。

6、2、ddpg(deep deterministic policy gradient)，深度确定性策略梯度算法，ddpg是一种基于深度学习的强化学习算法，它结合了深度神经网络和策略梯度方法。ddpg包含两个主要部分：一个策略网络(actor)和一个值函数网络(critic)。actor网络用于输出动作，而critic网络用于评估动作的价值。

7、本专利技术的技术方案为：

8、基于强化学习的锂离子电池低温加热与充电协同优化控制方法，包括：

9、模型方程建立：建立锂离子电池的电热耦合模型；

10、初始化：初始化强化学习模型的动作空间、状态空间，初始化强化学习模型的策略网络和价值网络的网络参数；

11、多状态感知：实时获取锂离子电池的状态信息，包括交流电流、直流电流、电压、soc和内部核温；

12、目标函数、奖励函数与约束设计：设置奖励函数，并设计动作和状态变量的上下限，目标包括充电速度和升温产热；

13、策略优化：将当前状态变量输入策略网络，策略网络负责根据当前状态选择两个动作包括交流动作和直流动作，并将动作输入锂离子电池的电热耦合模型，获取下一个状态并输出相应的奖励，同时将当前经验存储于经验回放池中，并从经验回放池中随机抽出样本用于训练；通过价值网络评价当前所选动作，更新状态和网络参数，进而优化强化学习模型，直至循环训练到达最大迭代次数；输出奖励函数在约束下最大化奖励回报的动作值；

14、控制执行：根据当前电池的状态，在奖励函数的约束下，根据优化计算出的加热交流和充电直流，控制加热器和充电器工作，输出加热交流和充电直流，锂离子电池根据最优加热和充电电流进行充电。

15、进一步优选的，动作空间包括电池的交流电流分量和直流电流分量，状态空间包括电池的荷电状态(state of charge，soc)、电池电压和电池内部核温。

16、进一步优选的，状态空间中每个状态变量st被定义为：

17、st＝{soc,[tc]nor,[uo]nor}

18、其中，soc表示电池的荷电状态，[tc]nor表示电池内部核温，[uo]nor表示电池电压。

19、进一步优选的，动作空间中每个动作变量at被定义为：

20、at＝{[iac]nor,[idc]nor}

21、其中，[iac]nor表示电池的交流电流分量，[idc]nor表示电池的直流电流分量。

22、进一步优选的，状态变量和动作变量均通过归一化至[0,1]的区间范围，归一化计算公示如下：

23、

24、其中，x表示当前状态变量或动作变量值，xmax表示设置的状态变量或动作变量最大值，xmin表示设置的状态变量或动作变量最小值，xnorm表示状态变量或动作变量归一化后值。

25、进一步优选的，设置两个目标函数，包括充电速度目标函数和升温产热目标函数；

26、充电速度目标函数j1表述为：

27、j1＝minnt

28、其中，t是指采样周期，n是指达到充电完成的采样步骤数；充电速度目标函数j1是最短时间内实现充电；

29、升温产热目标函数j2表述为：

30、j2＝maxqgen

31、其中，qgen是指电池加热充电过程中的总产热量。

32、进一步优选的，奖励函数表述为：

33、

34、其中，ωi分别是不同目标函数的权重系数，i＝1～6；rsoc(t)是电池soc奖励函数，rqgen(t)是电池产热奖励函数，rvolt(t)是电池电压奖励函数，rtemp(t)是电池核温奖励函数，ridc(t)是电池直流电流奖励函数，riac(t)是电池交流电流奖励函数；

35、rsoc(t)奖励函数表述为：

36、rsoc(t)＝|soctar-soc(t)|

37、其中，soctar表示目标soc值，soc(t)表示当前电池soc；

38、rqgen(t)奖励函数表述为：

39、

40、rvolt(t)，rtemp(t)，ridc(t)，riac(t)作为软约束奖励函数，具体表述为：

41、

42、

43、其中，uo(t)表示当前电池电压，umax表示电压的最大阈值；tc(t)表示当前电池核温，tmax表示温度的最大阈值；idc(t)表示当前电池直流分量，idc_max表示直流分量的最大阈值；iac(t)表示当前电池交流分量，iac_max表示交流分量的最大阈值。

44、根据本专利技术优选的，锂离子电池的电热耦合模型包括电气模型和双本文档来自技高网...

【技术保护点】

1.基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，包括：

2.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，状态空间中每个状态变量st被定义为：

3.根据权利要求2所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，状态变量和动作变量均通过归一化至[0,1]的区间范围，归一化计算公示如下：

4.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，设置两个目标函数，包括充电速度目标函数和升温产热目标函数；

5.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，奖励函数表述为：

6.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，锂离子电池的电热耦合模型包括电气模型和双态热模型；电气模型包括欧姆阻抗Ro、极化阻抗Rct和电荷转移过程的电容Cdl、电压源UOCV、电感L和瓦尔堡阻抗Zw；

7.根据权利要求1-6任一所述

8.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1-7任一所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法的步骤。

9.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-7任一所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法的步骤。

10.基于强化学习的锂离子电池低温加热与充电协同优化控制系统，其特征在于，包括：

...

【技术特征摘要】

1.基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，包括：

2.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，状态空间中每个状态变量st被定义为：

5.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，奖励函数表述为：

6.根据权利要求1所述的基于强化学习的锂离子电池低温加热与充电协同优化控制方法，其特征在于，锂离子电池的电热耦合模型包括电气模型...

【专利技术属性】
技术研发人员：王楠，申涛，崔忠瑞，张云，叶桂森，
申请(专利权)人：济南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人