一种电网调度控制模型的构建方法及电网调度控制方法技术

技术编号:26176994 阅读:44 留言:0更新日期:2020-10-31 14:18
本申请提供了一种电网调度控制模型的构建方法及电网调度控制方法,该电网调度控制模型的构建方法包括:获取电网的多个历史断面潮流数据;根据预设的安全运行需求和控制目标,构造基于最大熵强化学习算法的电网调度控制模型;从多个历史断面潮流数据中提取训练样本,并将训练样本输入电网调度控制模型进行模型训练,得到各电网控制动作;根据历史断面潮流数据执行各电网控制动作后的电网运行特征,更新电网调度控制模型的模型参数,并返回从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤,直至所有训练样本训练完成;根据训练结果确定最优电网调度控制模型。为提高电网调度控制效率和性能奠定了基础。

A construction method of power grid dispatching control model and power grid dispatching control method

【技术实现步骤摘要】
一种电网调度控制模型的构建方法及电网调度控制方法
本专利技术涉及电网调控领域,具体涉及一种电网调度控制模型的构建方法及电网调度控制方法。
技术介绍
随着电网建设的不断推进,电网运行的不确定性、动态性和多元性也在显著增强。为了提高电网的安全性,电力系统实时调控决策的制定成为了研究的重点。在现有技术中,通常是监测电网的各项安全指标,如电压、频率以及线路潮流等,当任一项安全指标出现偏差时,发出告警信息,以提醒操作人员采取相应的调度控制措施。但是,当面临突发性的电网严重故障时,若采用现有调控技术未能及时准确的对电网进行调控,将会错过最佳的调控时间,导致电网故障扩散。因此,急需一种智能的电网调度控制模型,对提高电网调度控制效率有重要意义。
技术实现思路
因此,本专利技术要解决的技术问题在于克服现有技术中的电网调度控制效率和精准度较低的缺陷,从而提供一种电网调度控制模型的构建方法及电网调度控制方法。本申请第一个方面提供一种电网调度控制模型的构建方法,包括:获取电网的多个历史断面潮流数据;根据预设的安全运行需求和控制目标,构造基于最大熵强化学习算法的电网调度控制模型;从多个历史断面潮流数据中提取训练样本,并将所述训练样本输入所述电网调度控制模型进行模型训练,得到各电网控制动作,所述训练样本包括当前电网运行指标对应的电网运行特征;根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征,更新所述电网调度控制模型的模型参数,并返回所述从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤,直至所有训练样本训练完成;根据训练结果确定最优电网调度控制模型。可选的,所述根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征,更新所述电网调度控制模型的模型参数,包括:获取历史断面潮流数据执行当前电网控制动作后的电网运行特征;根据预设奖惩函数及所述电网运行特征确定当前电网控制动作对应的奖励值;根据所述奖励值调整所述电网调度控制模型的模型参数。可选的,所述根据预设奖惩函数及所述电网运行指标确定当前电网控制动作对应的奖励值,包括:当确定控制前的电网运行特征的越限情况为电压越限或潮流越限时,根据如下预设奖惩函数计算各电网控制动作对应的奖励值:其中,reward表示所述奖励值,dev_overflow表示潮流越限值,vio_voltage表示电压越限值;当确定控制前的电网运行特征的越限情况为电压和潮流均未越限,且控制后的网损变化为网损减小时,根据如下预设奖惩函数计算各电网控制动作对应的奖励值:reward=50-delta_p_loss*1000其中,delta_p_loss表示控制后的网损变化值;当确定控制前的电网运行特征的越限情况为电压和潮流均未越限,且所述网损变化值大于或等于预设阈值时,所述奖励值reward=-100。可选的,所述从多个历史断面潮流数据中提取训练样本,包括:从所述历史断面潮流数据中提取所述电网运行特征;根据所述电网运行特征,判断所述历史断面潮流是否呈收敛状态;当确定所述历史断面潮流呈收敛状态时,从所述历史断面潮流数据中提取训练样本。可选的,还包括:按照预设周期对所述最优电网调度控制模型进行性能检测,并根据性能检测结果对所述最优电网调度控制模型的模型参数进行更新。本申请第二个方面提供一种电网调度控制方法,包括:采集电网的实时断面潮流数据;将所述实时断面潮流数据输入至第一个方面及第一个方面任意一种可选实施方式中所提供的电网调度控制模型的构建方法所构建的最优电网调度控制模型中,以生成对应的电网控制动作指令;根据所述电网控制动作指令,进行相应的电网调度控制。本申请第三个方面提供一种电网调度控制模型的构建装置,包括:获取模块、构造模块、第一训练模块、第二训练模块和优化模块;所述获取模块用于获取电网的多个历史断面潮流数据;所述构造模块用于根据预设的安全运行需求和控制目标,构造基于最大熵强化学习算法的电网调度控制模型;所述第一训练模块用于从多个历史断面潮流数据中提取训练样本,并将所述训练样本输入所述电网调度控制模型进行模型训练,得到各电网控制动作,所述训练样本包括当前电网运行指标对应的电网运行特征;所述第二训练模块用于根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征,更新所述电网调度控制模型的模型参数,并返回所述从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤,直至所有训练样本训练完成;所述优化模块用于根据训练结果确定最优电网调度控制模型。可选的,第二训练模块具体用于:获取历史断面潮流数据执行当前电网控制动作后的电网运行特征;根据预设奖惩函数及所述电网运行特征确定当前电网控制动作对应的奖励值;根据所述奖励值调整所述电网调度控制模型的模型参数。可选的,第二训练模块具体用于:当确定控制前的电网运行特征的越限情况为电压越限或潮流越限时,根据如下预设奖惩函数计算各电网控制动作对应的奖励值:其中,reward表示所述奖励值,dev_overflow表示潮流越限值,vio_voltage表示电压越限值;当确定控制前的电网运行特征的越限情况为电压和潮流均未越限,且控制后的网损变化为网损减小时,根据如下预设奖惩函数计算各电网控制动作对应的奖励值:reward=50-delta_p_loss*1000其中,delta_p_loss表示控制后的网损变化值;当确定控制前的电网运行特征的越限情况为电压和潮流均未越限,且所述网损变化值大于或等于预设阈值时,所述奖励值reward=-100。可选的,所述第一训练模块具体用于:从所述历史断面潮流数据中提取所述电网运行特征;根据所述电网运行特征,判断所述历史断面潮流数据是否呈收敛状态;当确定所述历史断面潮流数据呈收敛状态时,从所述历史断面潮流数据中提取训练样本。可选的,所述第二训练模块还用于:按照预设周期对所述最优电网调度控制模型进行性能检测,并根据性能检测结果对所述最优电网调度控制模型的模型参数进行更新。本申请第四个方面提供一种电网调度控制装置,包括:采集模块、决策模块和执行模块;所述采集模块用于采集电网的实时断面潮流数据;所述决策模块,用于将所述实时断面潮流数据输入至第三个方面所提供的电网调度控制模型的构建装置所构建的最优电网调度控制模型中,以生成对应的电网控制动作指令;所述执行模块,用于根据所述电网控制动作指令,进行相应的电网调度控制。本申请第五个方面提供一种电子设备,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述至少一个处理器执行第一个方面及其第本文档来自技高网...

【技术保护点】
1.一种电网调度控制模型的构建方法,其特征在于,包括:/n获取电网的多个历史断面潮流数据;/n根据预设的安全运行需求和控制目标,构造基于最大熵强化学习算法的电网调度控制模型;/n从多个历史断面潮流数据中提取训练样本,并将所述训练样本输入所述电网调度控制模型进行模型训练,得到各电网控制动作,所述训练样本包括当前电网运行指标对应的电网运行特征;/n根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征,更新所述电网调度控制模型的模型参数,并返回所述从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤,直至所有训练样本训练完成;/n根据训练结果确定最优电网调度控制模型。/n

【技术特征摘要】
1.一种电网调度控制模型的构建方法,其特征在于,包括:
获取电网的多个历史断面潮流数据;
根据预设的安全运行需求和控制目标,构造基于最大熵强化学习算法的电网调度控制模型;
从多个历史断面潮流数据中提取训练样本,并将所述训练样本输入所述电网调度控制模型进行模型训练,得到各电网控制动作,所述训练样本包括当前电网运行指标对应的电网运行特征;
根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征,更新所述电网调度控制模型的模型参数,并返回所述从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤,直至所有训练样本训练完成;
根据训练结果确定最优电网调度控制模型。


2.根据权利要求1所述的电网调度控制模型的构建方法,其特征在于,所述根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征,更新所述电网调度控制模型的模型参数,包括:
获取历史断面潮流数据执行当前电网控制动作后的电网运行特征;
根据预设奖惩函数及所述电网运行特征确定当前电网控制动作对应的奖励值;
根据所述奖励值调整所述电网调度控制模型的模型参数。


3.根据权利要求2所述的电网调度控制模型的构建方法,其特征在于,所述根据预设奖惩函数及所述电网运行指标确定当前电网控制动作对应的奖励值,包括:
当确定控制前的电网运行特征的越限情况为电压越限或潮流越限时,根据如下预设奖惩函数计算各电网控制动作对应的奖励值:



其中,reward表示所述奖励值,dev_overflow表示潮流越限值,vio_voltage表示电压越限值;
当确定控制前的电网运行特征的越限情况为电压和潮流均未越限,且控制后的网损变化为网损减小时,根据如下预设奖惩函数计算各电网控制动作对应的奖励值:
reward=50-delta_p_loss*1000
其中,delta_p_loss表示控制后的网损变化值;
当确定控制前的电网运行特征的越限情况为电压和潮流均未越限,且所述网损变化值大于或等于预设阈值时,所述奖励值reward=-100。


4.根据权利要求1所述的电网调度控制模型的构建方法,其特征在于,所述从多个历史断面潮流数据中提取训练样本,包括:
从所述历史断面潮流数据中提取所述电网运行特征;
根据所述电网运行特征,判断所述历史断面潮流数据是否呈收敛状态;
当确定所述历史断面潮流数据呈收敛状态时,从所述历史断面潮流数据中提取训练样本。

【专利技术属性】
技术研发人员:刁瑞盛史迪张蓓王司琪段嘉俊
申请(专利权)人:全球能源互联网研究院有限公司国家电网有限公司国网山西省电力公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1