System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及电力系统控制,特别是涉及一种切机稳控策略确定方法、装置、计算机设备、存储介质和计算机程序产品。
技术介绍
1、随着大量新能源和大量的电力电子设备的接入电力系统,电力系统存在设备多样性、电路机理复杂性和电力不确定性等情况。并且新能源产生的输出存在不确定性,可以改变电网的瞬态稳定特性,导致电力系统和电网的安全稳定性不足。
2、相关技术中,可以通过物理模型和实时仿真方法确定稳控策略,并通过稳控策略提升电力系统的安全稳定性。但是,物理模型需要进行额外改进,以确保系统的协同工作,会增加系统的复杂性。实时仿真中对于新能源电力系统的切机量计算缺乏理论指导,导致稳控策略的生成过程中存在冗余切机稳控策略。因此,通过上述相关技术在生成稳控策略时存在生成稳控策略的效率不足的问题。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提升稳控策略生成效率的切机稳控策略确定方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本申请提供了一种切机稳控策略确定方法。所述方法包括:
3、确定电力系统的训练特征数据;所述训练特征数据是对所述电力系统在预设时间段的电气量数据进行筛选得到的;
4、基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型;所述安全约束模型是基于马尔可夫决策过程对所述电力系统的切机稳控策略进行建模得到的;所述安全约束模型包含所述马尔可夫决策过程对应的五元组和深度学习网络;
5、将所述电力系统的目标电气量数据输入所述训练好的安全约束模型,得到所述目标电气量数据对应的切机稳控策略;
6、其中,所述状态空间用于表示所述电力系统中各发电机对应的多个节点在不同时间点对应的电气量数据;所述动作空间用于表示所述电力系统中各发电机对应的切机指令;所述奖励函数用于表示通过动作空间的切机指令对所述电力系统进行切机后,所述切机指令所造成的奖励值。
7、在其中一个实施例中,所述基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型之前,所述方法还包括:
8、基于所述电力系统中各发电机在不同时间点下的电气量数据,生成状态空间;所述电气量数据包括发电机转子转速、发电机功角、转子加速度、母线电压和母线电流;
9、基于所述电力系统中各发电机在不同时间点下的切机指令,生成动作空间;其中,所述切机指令用于确定发电机是否进行切机操作;
10、基于所述电力系统中各发电机对应的功角稳定奖励和所述发电机在采取动作空间对应的切机指令后的切机量惩罚,确定奖励函数;
11、确定至少一个约束条件;所述约束条件包括切机动作时序约束、切机机组选择约束和切机量约束。
12、在其中一个实施例中,所述基于所述电力系统中各发电机对应的功角稳定奖励和所述发电机在采取动作空间对应的切机指令后的切机量惩罚,确定奖励函数,包括:
13、确定在同一时间点所述发电机间的最大功角差,并根据所述最大功角差的值,确定所述最大功角差对应的功角稳定奖励;
14、将各时间点对应的状态空间和动作空间的乘积值,确定为切机量惩罚;
15、确定所述功角稳定奖励与所述切机量惩罚的差值,为奖励函数。
16、在其中一个实施例中,所述确定至少一个约束条件,包括:
17、基于所述电气量数据对应的时间周期,以及基于相邻时间点对应的动作空间的差值,确定所述切机动作时序约束;所述切机动作时序约束用于限制动作空间在不同时间点的取值范围;
18、基于所述发电机的工角加速度,确定所述切机机组选择约束;所述切机机组选择约束用于限制切机所选择的发电机;
19、基于所述电力系统的负荷功率,确定所述切机量约束;所述切机量约束用于限制进行切机指令的发电机的数量。
20、在其中一个实施例中,所述确定电力系统的训练特征数据,包括:
21、获取电力系统在预设时间段的电气量数据;
22、基于各类型的电气量数据对应的类内距离,确定所述电气量数据对应的区分度因子;所述类内距离是基于各时间点各类型的电气量数据之间的距离确定的;所述区分度因子是基于不同时间点对应类内距离确定的;
23、基于按大小顺序排列的各电气量数据对应的区分度因子,确定相邻的区分度因子间的等级差,并基于所述等级差,确定所述相邻的区分度因子对应的等级相关系数;
24、若所述等级相关系数大于预设值,则确定所述等级相关系数对应的电气量数据为训练特征数据。
25、在其中一个实施例中,所述深度学习网络包括评价网络和动作网络;所述基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型,包括:
26、确定所述训练特征数据在所述状态空间的初始状态值、在所述动作空间的初始动作指令,以及在所述奖励函数对应的初始奖励值;
27、基于所述动作网络、所述评价网络和所述折扣系数,对所述初始状态值和所述初始动作指令进行更新,并确定所述初始奖励值对应的预测奖励值和真实奖励值;所述更新过程满足所述约束条件;
28、更新所述动作网络的第一参数和所述评价网络的第二参数,直到所述预测奖励值和真实奖励值间的损失值满足训练结束条件,得到训练好的安全约束模型。
29、在其中一个实施例中,所述将所述电力系统的目标电气量数据输入所述训练好的安全约束模型,得到所述目标电气量数据对应的切机稳控策略,包括:
30、将所述电力系统的目标电气量数据输入所述训练好的安全约束模型,得到所述目标电气量数据对应的目标状态空间;
31、确定所述目标状态空间对应的动作指令,为切机稳控策略。
32、第二方面,本申请还提供了一种切机稳控策略确定装置。所述装置包括:
33、数据确定模块,用于确定电力系统的训练特征数据;所述训练特征数据是对所述电力系统在预设时间段的电气量数据进行筛选得到的;
34、模型训练模块,用于基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型;所述安全约束模型是基于马尔可夫决策过程对所述电力系统的切机稳控策略进行建模得到的;所述安全约束模型包含所述马尔可夫决策过程对应的五元组和深度学习网络;所述五元组包括状态空间、动作空间、约束条件、奖励函数和折扣系数;其中,所述状态空间用于表示所述电力系统中各发电机对应的多个节点在不同时间点对应的电气量数据;所述动作空间用于表示所述电力系统中各发电机对应的切机指令;所述奖励函数用于表示通过动作空间的切机指令对所述电力系统进行切机后,所述切机指令所造成的奖励值;
35、策略确定模块,用于将所述电力系统的目标电气量数据输入所述训练好的安全约束模型,得到所述目标电气量数据对应的本文档来自技高网...
【技术保护点】
1.一种切机稳控策略确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述电力系统中各发电机对应的功角稳定奖励和所述发电机在采取动作空间对应的切机指令后的切机量惩罚,确定奖励函数,包括:
4.根据权利要求2所述的方法,其特征在于,所述确定至少一个约束条件,包括:
5.根据权利要求1所述的方法,其特征在于,所述确定电力系统的训练特征数据,包括:
6.根据权利要求1所述的方法,其特征在于,所述深度学习网络包括评价网络和动作网络;所述基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型,包括:
7.根据权利要求6所述的方法,其特征在于,所述将所述电力系统的目标电气量数据输入所述训练好的安全约束模型,得到所述目标电气量数据对应的切机稳控策略,包括:
8.一种切机稳控策略确定装置,其特征
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
...【技术特征摘要】
1.一种切机稳控策略确定方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述电力系统对应的训练特征数据,对安全约束模型进行训练,得到训练好的安全约束模型之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述电力系统中各发电机对应的功角稳定奖励和所述发电机在采取动作空间对应的切机指令后的切机量惩罚,确定奖励函数,包括:
4.根据权利要求2所述的方法,其特征在于,所述确定至少一个约束条件,包括:
5.根据权利要求1所述的方法,其特征在于,所述确定电力系统的训练特征数据,包括:
6.根据权利要求1所述的方法,其特征在于,所述深度学习网络包括评价网...
【专利技术属性】
技术研发人员:张建新,高琴,姜拓,吕龙,杨欢欢,祝万,刘梓宁,夏尚学,刘春晓,杜旭,王巍,
申请(专利权)人:中国南方电网有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。