System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于模糊控制和强化学习的电网电压控制方法技术_技高网

一种基于模糊控制和强化学习的电网电压控制方法技术

技术编号:44665161 阅读:2 留言:0更新日期:2025-03-19 20:22
本发明专利技术涉及一种基于模糊控制和强化学习的电网电压控制方法,包括以下步骤:步骤1、构建模糊控制模块,获取当前的电网状态变量,在每个时间步,使用模糊控制模块根据当前的电网状态变量进行推理,得出初步的无功控制量;步骤2、构建强化学习模型,将步骤1中模糊控制模块得出的初步无功控制量作为强化学习模块的一个输入,与当前的电网状态一起送入强化学习模型,强化学习模型根据当前状态和初步无功控制量,学习验证并输出最终的控制动作;步骤3、执行步骤2输出的最终的控制动作,调整发电机组的输出或调整其他无功补偿装置,以维持电网的电压稳定。本发明专利技术能够解决控制算法鲁棒性较差、系统复杂的技术问题。

【技术实现步骤摘要】

本专利技术属于电网电压控制,涉及一种电网电压控制方法,尤其是一种基于模糊控制和强化学习的电网电压控制方法


技术介绍

1、供电电压是电能质量的重要指标之一,无功补偿与无功平衡是保证供电电压质量的重要手段,同时对电力系统安全稳定与经济运行起着重要作用。在现有的大电网基础下,各地区无功管理一般采用“分层分区、就地平衡”的原则。

2、当前电网电压调节主要是通过自动电压控制来调整,自动电压控制是指对全网无功电压状态进行集中监视和分析计算,从全局的角度对广域分散的电网无功装置进行协调优化控制,不仅可以实现对无功、电压的自动调节,而且具有一定的优化功能,是保持系统电压稳定、提升电网电压品质和整个系统经济运行水平的重要手段。将控制器连接在调整设备上,控制简单。调压器是采用自动调节电压的装置,通过传感器将电网电压传输到装置中,利用调压器的自动控制,不断调整电网电压。目前各省公司自动电压控制系统一般由一个中心控制子系统和三个分散控制子系统组成,控制模型及算法一般采用最优潮流和约束条件,此类算法存在动态分区结果不实用、系统复杂、控制算法鲁棒性不高等缺点。

3、因此,为解决上述问题,本专利技术提出一种基于模糊控制和强化学习的电网电压控制方法。

4、经检索,未发现与本专利技术相同或相似的现有技术的公开文献。


技术实现思路

1、本专利技术的目的在于克服现有技术的不足,提出一种基于模糊控制和强化学习的电网电压控制方法,该控制方法能够简化控制系统、具有较强的适应性和鲁棒性,并且容错性效果较好,系统平衡性较好,解决之前控制算法鲁棒性较差、系统复杂的技术问题。

2、本专利技术解决其现实问题是采取以下技术方案实现的:

3、一种基于模糊控制和强化学习的电网电压控制方法,包括以下步骤:

4、步骤1、构建模糊控制模块,获取当前的电网状态变量,在每个时间步,使用模糊控制模块根据当前的电网状态变量进行推理,得出初步的无功控制量;

5、步骤2、构建强化学习模型,将步骤1中模糊控制模块得出的初步无功控制量作为强化学习模块的一个输入,与当前的电网状态一起送入强化学习模型,强化学习模型根据当前状态和初步无功控制量,学习验证并输出最终的控制动作;

6、步骤3、执行步骤2输出的最终的控制动作,调整发电机组的输出或调整其他无功补偿装置,以维持电网的电压稳定;观察新的状态和奖励,反馈给强化学习模型,进行策略更新。

7、而且,所述步骤1的构建模糊控制模块具体步骤包括:

8、(1)构建模糊子集:

9、电压偏差:{nb(负大)、ns(负小)、zo(零)、ps(正小)、pb(正大)}

10、电压变化率:{nb(负大)、ns(负小)、zo(零)、ps(正小)、pb(正大)}

11、(2)建立模糊推理规则:

12、建立模糊规则表,进行模糊推理;

13、1)如果电压偏差为“nb(负大)”且电压变化率为“nb(负大)”,则模糊推理为pb(正大),表示较大限度增加无功补偿。

14、2)如果电压偏差为“ns(负小)”且电压变化率为“ns(负小)”,则模糊推理为ps(正小),表示较小限度增加无功补偿。

15、3)如果电压偏差为“zo(零)”且电压变化率为“zo(零)”,则模糊推理为zo(零),表示电压在正常范围内,无功补偿暂不作调整。

16、4)如果电压偏差为“ps(正小)”且电压变化率为“ps(正小)”,则模糊推理为ns(负小),表示较小限度减少无功补偿。

17、5)如果电压偏差为“pb(正大)”且电压变化率为“pb(正大)”,则模糊推理为nb(负大),表示较大限度减少无功补偿。

18、(3)进行解模糊化,得到模糊输出,并将模糊输出转换为具体数值;

19、而且,所述步骤1第(3)步的具体步骤包括:

20、①以电压偏差为例,将电压输入至隶属度函数计算,得到电压偏差对应的一个或多个隶属于某个模糊子集的隶属度值;

21、②将实际测量的电压偏差和电压变化率转换为模糊集合的隶属度函数;

22、③根据模糊规则表,得到模糊输出:

23、④将模糊输出转换为具体的数值,进而获得出初步的无功控制量。

24、而且,所述步骤2的具体步骤包括:

25、(1)定义状态空间

26、各节点电压:将其离散化为几个区间,如“低”、“中”、“高”。

27、电网频率:离散化为“低”、“中”、“高”。

28、负载需求:各个节点的负载需求,离散化为“低”、“中”、“高”。

29、电源输出:各个发电机的有功和无功输出,离散化为“低”、“中”、“高”。

30、无功补偿:已投入的无功补偿设备的数量或容量,离散化为“低”、“中”、“高”。

31、(2)定义动作空间

32、调整有功输出:增加或减少发电机的有功输出。

33、调整无功输出:增加或减少发电机的无功输出。

34、切除无功补偿设备:减少无功补偿设备的投入。

35、投入无功补偿设备:增加无功补偿设备的投入。

36、调整分接头:改变变压器的分接头位置,以调节电压。

37、(3)定义奖励函数

38、电压稳定性:当所有节点的电压水平都在允许范围内时,给予正向奖励;否则,给予负向惩罚。

39、频率稳定性:当电网频率在允许范围内时,给予正向奖励;否则,给予负向惩罚。

40、负载跟踪精度:当电网输入功率与负载需求匹配良好时,给予正向奖励;否则,给予负向惩罚。

41、最小化运营成本:当运营成本较低时,给予正向奖励;否则,给予负向惩罚。

42、(4)初始化q表

43、创建一个q表,其中状态s指的是所有节点的状态集合,状态集s={s1,s2,s3…si},动作a指的是所有动作情况,动作集a={a1,a2,a3…ai}。初始情况下,q表中的值可以全部设置为0或者小的随机数。

44、(5)选择学习率和折扣因子

45、学习率(α):决定了新获得的信息覆盖旧信息的速度,通常取值在0.1到0.5之间。

46、折扣因子(γ):反映了未来奖励的现值相对于即时奖励的重要性,通常取值在0.9到0.99之间。

47、(6)执行q-learning算法,输出最终的控制动作;

48、1)初始化:从某个初始状态开始,例如电网的初始状态为(s0)。

49、2)选择动作:根据当前的q表和ε-greedy策略选择一个动作(a0)。例如,设定ε=0.1,即有90%的概率选择当前q表中预期回报最高的动作,10%的概率随机选择动作;

50、3)输出最终的控制动作。

51、而且,所述步骤3的具体步骤包括:

52、(1)执行动作:本文档来自技高网...

【技术保护点】

1.一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:所述步骤1的构建模糊控制模块具体步骤包括:

3.根据权利要求2所述的一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:所述步骤1第(3)步的具体步骤包括:

4.根据权利要求1或2所述的一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:所述步骤2的具体步骤包括:

5.根据权利要求1或2所述的一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:所述步骤3的具体步骤包括:

【技术特征摘要】

1.一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:包括以下步骤:

2.根据权利要求1所述的一种基于模糊控制和强化学习的电网电压控制方法,其特征在于:所述步骤1的构建模糊控制模块具体步骤包括:

3.根据权利要求2所述的一种基于模糊控制和强化学习的电网电压控制方法,其...

【专利技术属性】
技术研发人员:韩蒲峰刘超王泉乐李建于国建王国友高佳冀安立锋张希栋孙林凯付建民高天洋
申请(专利权)人:国网天津市电力公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1