基于无模型积分强化学习算法的离网逆变器电压控制方法技术

技术编号：41323337 阅读：33 留言：0更新日期：2024-05-13 15:01

本发明专利技术公开了一种基于无模型积分强化学习算法的离网逆变器电压控制方法，包括：建立d‑q坐标系下的LC型离网逆变器的数学模型，定义逆变器输出电压参考信号与d‑q轴电压电流信号为增广系统状态，将离网逆变器电压控制问题转化为增广系统的H<subgt;∞</subgt;跟踪问题；基于零和博弈思想，建立跟踪Hamilton‑Jacobi‑Isaacs(HJI)方程，提出无模型IRL算法求解HJI方程；给定初始控制增益、初始扰动增益，在探测噪声作用下收集增广系统状态数据，根据测量数据计算包含状态值、控制输入值和扰动值的Kronecker积，推导出迭代逆变器电压控制策略。本发明专利技术通过利用无模型IRL解决了离网逆变器电压控制中的模型参数未知、复杂负载投切造成强扰动问题。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于离网逆变器电压控制领域，主要涉及基于无模型irl算法的离网逆变器电压控制方法。

技术介绍

1、传统化石能源短缺和环境污染成为世界经济发展的障碍，可再生能源和微电网技术因其优点成为有效应对之策。然而，离网运行时逆变器系统受非线性负载和不平衡负载影响，造成输出电压质量下降，甚至系统不稳定。因此，如何设计良好的控制策略以提高微网逆变器系统的抗扰能力具有重要意义。

2、近年来，许多学者提出了多种控制方法用于提高逆变器的抗扰性能，如无模型预测控制、重复控制和自抗扰控制。然而，这些方法存在着权衡问题、跟随延迟、参数调节困难、计算复杂度高以及鲁棒性不足等一系列挑战。

3、逆变器电压控制问题可以表述为一个参考电压的跟踪和抗扰问题。h∞控制致力于抑制外部的、随机变化的、错综复杂的干扰对系统性能的影响。h∞控制器不仅可以实现被控系统的动态稳定与鲁棒控制，还可以优化被控系统的性能指标。对于离网逆变器，在控制器的设计中不仅要考虑参数的波动和不确定性，还需要考虑负载变化产生的扰动，这与h∞控制理论目标相契合。基于强化学习(rl)的技术也被用于为h∞控制问题提供无模型解决方案。虽已有学者提出基于强化学习的逆变器电压控制方法，但未考虑将离散方法应用于连续系统可能带来的近似误差和数值稳定性问题，以及未充分考虑负载变化带来的外部扰动对系统的影响。

4、因此，迫切需要开发一种具有自学习能力的离网逆变器电压控制策略，在含有未知动态和负载变化情况下，仍可实现离网逆变器系统的h∞控制。

技术实现思路

1、本专利技术提供了一种基于无模型irl算法的离网逆变器电压控制方法，其能够解决模型未知和含有复杂负载投切的离网逆变器系统h∞跟踪控制问题，使得离网逆变器系统控制策略具有自适应、自学习能力。

2、为解决上述技术问题，本专利技术采用如下技术方案：一种基于无模型irl算法的离网逆变器电压控制方法，包括：

3、步骤1，建立d-q坐标系下的lc型离网逆变器的数学模型，定义逆变器输出电压参考信号与d-q轴电压电流信号为增广系统状态，将离网逆变器电压控制问题转化为增广系统的h∞跟踪问题；

4、步骤2，基于零和博弈思想，建立跟踪hamilton-jacobi-isaacs(hji)方程，提出无模型irl算法求解hji方程；

5、步骤3，给定初始控制增益、初始扰动增益，在探测噪声作用下收集增广系统状态数据，根据测量数据计算包含状态值、控制输入值和扰动值的kronecker积，推导出迭代逆变器电压控制策略。

6、进一步的，步骤1具体包括如下内容：

7、步骤101，lc型离网逆变器在d-q坐标系下的数学模型为：

8、

9、其中，ud、uq分别为逆变器桥臂侧电压在d、q轴分量；uod、uoq分别为逆变器输出电压在d、q轴分量；ild、ilq分别为滤波电感电流在d、q轴分量；iod、ioq分别为输出电流在d、q轴分量；ω为电网电压的角频率；

10、步骤102，将式(1)用以下状态空间方程描述：

11、

12、其中，x＝[uod uoq ild ilq]t是状态向量，u＝[ud uq]t是输入向量，d＝[iod ioq]t是扰动向量，y＝[uod uoq]t是输出向量，状态矩阵输入矩阵扰动矩阵输出矩阵

13、步骤103，逆变器参考电压满足

14、

15、其中，

16、则系统输出和参考信号之间的误差为

17、

18、步骤104，定义增广系统状态为则增广系统动态为：

19、

20、其中，c1＝[c -i]t；

21、步骤105，定义增广系统的l2增益条件为

22、

23、步骤106，定义跟踪代价函数为

24、

25、步骤107，h∞电压控制问题可表示为：寻找一个控制器

26、u＝kx (8)

27、满足以下条件：

28、1)闭环系统满足衰减条件式(6)

29、2)d＝0时的跟踪误差动力学式(4)是渐近稳定的。

30、进一步的，步骤2具体包括如下内容：

31、步骤201，h∞控制问题的可解性等价于下面零和博弈的可解性

32、

33、其中，j定义在式(7)中，v*(x(t))是最优值函数。若以下纳什均衡成立，此时二人零和博弈控制问题具有唯一的解

34、

35、步骤202，增广系统(5)的值函数表示为

36、v(x(t))＝x(t)tpx(t)＝j(u,d) (11)；

37、步骤203，将跟踪代价函数两边同时对t求导，可得如下bellman方程

38、(γx+mu+nd)tpx+xtp(γx+mu+nd)-αxtpx+ytqy+utru-γ2dtd＝0 (12)

39、相应的hamiltonian方程为

40、

41、步骤204，使用条件最优控制输入和最坏情况下的扰动输入为

42、u*＝-r-1mtpx (14)

43、d*＝γ-2ntpx (15)；

44、步骤205，将式(14)和式(15)带入式(12)，得到跟踪hji方程和跟踪博弈代数riccati方程(gare)

45、

46、

47、步骤206，将式(5)改写成

48、

49、其中，γi＝γ-mki+nli，则相应的bellman方程为:

50、

51、其中，

52、进一步的，步骤3具体包括如下内容：

53、步骤301，定义以下两个运算符

54、

55、有

56、步骤302，使用kronecker积，得到:

57、

58、

59、

60、

61、步骤303，对于任意给定的稳定控制增益ki，式(19)表示的线性方程的矩阵形式如下

62、

63、其中，

64、

65、步骤304，若满秩，则式(23)可以直接解为

66、

67、则推导出的电压控制迭代解为

68、u＝ki+1x (26)。

69、本专利技术的有益效果是：

70、1)本方法提出一种融合h∞控制和irl算法的连续逆变器电压内环控制新框架，可有效保证具有未知参数和负载扰动的逆变器的输出电压的质量。

71、2)本方法将离网逆变器电压控制问题转换为增广系统的h∞跟踪控制问题，基于零和博弈思想推导无模型irl算法，摆脱对逆变器模型的依赖，并将负载变化对逆变器电压的影响限制在一定的衰减水平。

本文档来自技高网...

【技术保护点】

1.一种基于无模型IRL算法的离网逆变器电压控制方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤2具体包括如下内容：

3.根据权利要求2所述方法，其特征在于，步骤2具体包括如下内容：

4.根据权利要求3所述方法，其特征在于，步骤3具体包括如下内容：

【技术特征摘要】

1.一种基于无模型irl算法的离网逆变器电压控制方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤2具体包括如下内容...

【专利技术属性】
技术研发人员：周林娜，李福星，刘晓敏，陈杨，杨春雨，厉功贺，张泉泉，马磊，王浩宇，冯琨，
申请(专利权)人：中国矿业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人