System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电力系统,并且更具体地,涉及一种电力系统电力拓扑架构的优化方法、装置及电子设备。
技术介绍
1、随着新能源和有源化负荷在电网中的占比逐渐提升,电网的动态性和不确定性日益增强,给电网运行和系统调度人员带来了新的挑战。现有的电网调控手段主要集中在发电侧和负荷侧,然而电力网络作为电能的传输途径与载体,对其拓扑结构的系统级优化控制在研究和实际中却考虑较少。电网实时拓扑优化控制是一种具有成本低、前景广阔且尚未得到充分利用的系统缓解措施。但由于其对应数学问题的组合性和高度非线性等特点,常规的优化算法很难在短时间内完成求解。从安全和经济角度来看,最大化系统的可用传输容量对电力系统至关重要。这代表了传输网络的剩余传输容量,可用于进一步的新能源消纳和能源交易。考虑到环境和经济的因素,未来通过建设新线路的方式来扩大系统传输能力对于电网公司将会越来越难。此外,可再生能源、需求响应、电动汽车和电力电子设备的日益普及导致了更多的随机和动态行为,威胁到电网的安全稳定运行。因此,在满足各种安全约束的同时,考虑到系统的不确定性,开发电网实时拓扑优化控制策略以最大化可用传输容量变得至关重要。
2、电网中的拓扑优化技术基于各种
技术介绍
,能够实现高效可靠的输电和配电。一些关键的
技术介绍
包括:电力系统分析:这项技术涉及对电力系统的行为进行建模和分析,包括潮流分析、暂态稳定性分析和故障分析。它为了解网络的当前状态和确定潜在的优化机会提供了基础。网络优化算法:这些算法使用数学优化技术来确定电网的最佳配置。它们考虑了各种限制,如负载需求、传输容量和
3、总体而言,电网中的拓扑优化技术依赖于电力系统分析、优化算法、数据分析、通信和控制系统以及可再生能源集成的组合,以确保高效可靠的输电和配电请求。
技术实现思路
1、为了解决现有技术的问题,本专利技术提供一种电力系统电力拓扑架构的优化方法、装置及电子设备。
2、根据本专利技术的一个方面,提供了一种电力系统电力拓扑架构的优化方法,包括:
3、对深度q网络模型的权值进行初始化,分配一个大小固定的缓冲区来优化存储代理的结果;
4、考察电力系统环境的当前状态,并使用环境贪婪策略选择一个动作并执行;
5、由深度q网络模型观察奖励/状态转换的结果,并观察电力系统环境中由此产生的状态转变;
6、存储学习过程中当前状态的观察体验、采取的行动、所获得的奖励以及由此产生的下一个状态;
7、从存储的体验中选择一批体验,通过将该批体验对应的预测q值与预设的目标q值之间的损失最小化,来更新深度q网络模型的权值和对应的预测q值,最终获得深度q网络模型输出的最优化动作;
8、根据最优化动作控制电力系统中的储能设备,以最大化电网的可用传输容量。
9、可选地,所述以在各类运行场景下最大化电网的可用传输容量为拓扑优化控制目标,建立深度q网络模型,包括:
10、以在各类运行场景下最大化电网的可用传输容量为拓扑优化控制目标,定义目标问题和实施环境;其中,目标问题需考虑每日负荷变化、提前一天的发电计划及实时发电计划的调整、母线电压允许范围、检修计划;
11、确定目标问题的动作和状态空间;
12、设计以深度q网络为主的强化学习算法,并按照目标问题、实施环境、目标问题的动作和状态空间,训练强化学习算法;
13、对训练后的强化学习算法进行评估与测试,直至满足预设的精度要求,得到深度q网络模型。
14、可选地,所述各类运行场景均需满足以下硬性约束条件:
15、用电需求在任何时刻都必须得到满足,即发电与负荷实时平衡;
16、最多只能有一个发电厂出现跳闸;
17、改变电力拓扑结构后不能在电网中形成孤岛;
18、电力系统潮流应始终收敛。
19、可选地,所述目标问题包括一个特定的约束条件,该特定的约束条件为:在操作线路开启和母线分裂运行过程中,物理设备有一定的冷却时间要求,在该冷却时间段内,物理设备不能连续动作两次及以上。
20、可选地,通过以下损耗函数li(θ)来更新深度q网络模型的权重及对应的预测q值:
21、li(θi)=es,a~ρ(·)[(yi-q(s,a;θi))2];
22、
23、式中,e为函数的期望值,s为某个系统状态,a为某个动作,ρ为状态和动作对(s,a)的概率分布;yi为时间差异目标;s′和a′为状态转移后的系统状态和动作;ε为电力系统环境中的系统状态分布,q为系统状态和动作对应的值函数,即电力系统在某个状态s下采取动作a所能得到的累计回报,θ为深度q网络模型的权重。
24、根据本专利技术的又一个方面,提供了一种电力系统电力拓扑架构的优化装置,包括:
25、模型建立模块,用于以在各类运行场景下最大化电网的可用传输容量为拓扑优化控制目标,建立深度q网络模型;
26、初始化模块,用于对深度q网络模型的权值进行初始化,分配一个大小固定的缓冲区来优化存储代理的结果;
27、动作执行模块,用于考察电力系统环境的当前状态,并使用环境贪婪策略选择一个动作并执行;
28、观察模块,用于由深度q网络模型观察奖励/状态转换的结果,并观察电力系统环境中由此产生的状态转变;
29、存储模块,用于存储学习过程中当前状态的观察体验、采取的行动、所获得的奖励以及由此产生的下一个状态;
30、更新模块,用于从存储的体验中选择一批体验,通过将该批体验对应的预测q值与预设的目标q值之间的损失最小化,来更新深度q网络模型的权值和对应的预测q值,最终获得深度q网络模型输出的最优化动作;
31、控制模块,用于根据最优化动作控制电力系统中的储能设备,以最大化电网的可用传输容量。
32、可选地,所述模型建立模块,具体用于:
33、以在各类运行场景下最大化电网的可用传输容量为拓扑优化控制目标,定义目标问题和实施环境;其中,目标问题需考虑每日负荷变化、提前一天的发电计划及实时发电计划的调整、母线电压允许范围、检修计划;
34、确定目标问题的动作和状态空间;
35、设计以深度q网络为主的强化学习算法,并按本文档来自技高网...
【技术保护点】
1.一种电力系统电力拓扑架构的优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述以在各类运行场景下最大化电网的可用传输容量为拓扑优化控制目标,建立深度Q网络模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述各类运行场景均需满足以下硬性约束条件:
4.根据权利要求2所述的方法,其特征在于,所述目标问题包括一个特定的约束条件,该特定的约束条件为:在操作线路开启和母线分裂运行过程中,物理设备有一定的冷却时间要求,在该冷却时间段内,物理设备不能连续动作两次及以上。
5.根据权利要求1所述的方法,其特征在于,通过以下损耗函数Li(θ)来更新深度Q网络模型的权重及对应的预测Q值:
6.一种电力系统电力拓扑架构的优化装置,其特征在于,包括:
7.根据权利要求6所述的装置,其特征在于,所述模型建立模块,具体用于:
8.根据权利要求7所述的装置,其特征在于,所述各类运行场景均需满足以下硬性约束条件:
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序
10.一种电子设备,其特征在于,所述电子设备包括:
...【技术特征摘要】
1.一种电力系统电力拓扑架构的优化方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述以在各类运行场景下最大化电网的可用传输容量为拓扑优化控制目标,建立深度q网络模型,包括:
3.根据权利要求2所述的方法,其特征在于,所述各类运行场景均需满足以下硬性约束条件:
4.根据权利要求2所述的方法,其特征在于,所述目标问题包括一个特定的约束条件,该特定的约束条件为:在操作线路开启和母线分裂运行过程中,物理设备有一定的冷却时间要求,在该冷却时间段内,物理设备不能连续动作两次及以上。
5.根据权利...
【专利技术属性】
技术研发人员:拉巴顿珠,贺文婷,索朗多布杰,张洪峰,曾非同,李小飞,杨玉鑫,李明佳,徐金成,周文龙,琼次仁,格桑曲珍,陈宇沁,周峰,殷小东,雷民,
申请(专利权)人:国网西藏电力有限公司营销服务中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。