一种电网调度控制模型的构建方法及电网调度控制方法技术

技术编号：26176994 阅读：44 留言：0更新日期：2020-10-31 14:18

本申请提供了一种电网调度控制模型的构建方法及电网调度控制方法，该电网调度控制模型的构建方法包括：获取电网的多个历史断面潮流数据；根据预设的安全运行需求和控制目标，构造基于最大熵强化学习算法的电网调度控制模型；从多个历史断面潮流数据中提取训练样本，并将训练样本输入电网调度控制模型进行模型训练，得到各电网控制动作；根据历史断面潮流数据执行各电网控制动作后的电网运行特征，更新电网调度控制模型的模型参数，并返回从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤，直至所有训练样本训练完成；根据训练结果确定最优电网调度控制模型。为提高电网调度控制效率和性能奠定了基础。

A construction method of power grid dispatching control model and power grid dispatching control method

全部详细技术资料下载

【技术实现步骤摘要】
一种电网调度控制模型的构建方法及电网调度控制方法
本专利技术涉及电网调控领域，具体涉及一种电网调度控制模型的构建方法及电网调度控制方法。
技术介绍
随着电网建设的不断推进，电网运行的不确定性、动态性和多元性也在显著增强。为了提高电网的安全性，电力系统实时调控决策的制定成为了研究的重点。在现有技术中，通常是监测电网的各项安全指标，如电压、频率以及线路潮流等，当任一项安全指标出现偏差时，发出告警信息，以提醒操作人员采取相应的调度控制措施。但是，当面临突发性的电网严重故障时，若采用现有调控技术未能及时准确的对电网进行调控，将会错过最佳的调控时间，导致电网故障扩散。因此，急需一种智能的电网调度控制模型，对提高电网调度控制效率有重要意义。
技术实现思路
因此，本专利技术要解决的技术问题在于克服现有技术中的电网调度控制效率和精准度较低的缺陷，从而提供一种电网调度控制模型的构建方法及电网调度控制方法。本申请第一个方面提供一种电网调度控制模型的构建方法，包括：获取电网的多个历史断面潮流数据；根据预设的安全运行需求和控制目标，构造基于最大熵强化学习算法的电网调度控制模型；从多个历史断面潮流数据中提取训练样本，并将所述训练样本输入所述电网调度控制模型进行模型训练，得到各电网控制动作，所述训练样本包括当前电网运行指标对应的电网运行特征；根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征，更新所述电网调度控制模型的模型参数，并返回所述从多个历史断面潮流数...

【技术保护点】
1.一种电网调度控制模型的构建方法，其特征在于，包括：/n获取电网的多个历史断面潮流数据；/n根据预设的安全运行需求和控制目标，构造基于最大熵强化学习算法的电网调度控制模型；/n从多个历史断面潮流数据中提取训练样本，并将所述训练样本输入所述电网调度控制模型进行模型训练，得到各电网控制动作，所述训练样本包括当前电网运行指标对应的电网运行特征；/n根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征，更新所述电网调度控制模型的模型参数，并返回所述从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤，直至所有训练样本训练完成；/n根据训练结果确定最优电网调度控制模型。/n

【技术特征摘要】
1.一种电网调度控制模型的构建方法，其特征在于，包括：
获取电网的多个历史断面潮流数据；
根据预设的安全运行需求和控制目标，构造基于最大熵强化学习算法的电网调度控制模型；
从多个历史断面潮流数据中提取训练样本，并将所述训练样本输入所述电网调度控制模型进行模型训练，得到各电网控制动作，所述训练样本包括当前电网运行指标对应的电网运行特征；
根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征，更新所述电网调度控制模型的模型参数，并返回所述从多个历史断面潮流数据中提取当前电网运行指标对应的电网运行特征作为训练样本的步骤，直至所有训练样本训练完成；
根据训练结果确定最优电网调度控制模型。

2.根据权利要求1所述的电网调度控制模型的构建方法，其特征在于，所述根据所述历史断面潮流数据执行各所述电网控制动作后的电网运行特征，更新所述电网调度控制模型的模型参数，包括：
获取历史断面潮流数据执行当前电网控制动作后的电网运行特征；
根据预设奖惩函数及所述电网运行特征确定当前电网控制动作对应的奖励值；
根据所述奖励值调整所述电网调度控制模型的模型参数。

3.根据权利要求2所述的电网调度控制模型的构建方法，其特征在于，所述根据预设奖惩函数及所述电网运行指标确定当前电网控制动作对应的奖励值，包括：
当确定控制前的电网运行特征的越限情况为电压越限或潮流越限时，根据如下预设奖惩函数计算各电网控制动作对应的奖励值：

其中，reward表示所述奖励值，dev_overflow表示潮流越限值，vio_voltage表示电压越限值；
当确定控制前的电网运行特征的越限情况为电压和潮流均未越限，且控制后的网损变化为网损减小时，根据如下预设奖惩函数计算各电网控制动作对应的奖励值：
reward＝50-delta_p_loss*1000
其中，delta_p_loss表示控制后的网损变化值；
当确定控制前的电网运行特征的越限情况为电压和潮流均未越限，且所述网损变化值大于或等于预设阈值时，所述奖励值reward＝-100。

4.根据权利要求1所述的电网调度控制模型的构建方法，其特征在于，所述从多个历史断面潮流数据中提取训练样本，包括：
从所述历史断面潮流数据中提取所述电网运行特征；
根据所述电网运行特征，判断所述历史断面潮流数据是否呈收敛状态；
当确定所述历史断面潮流数据呈收敛状态时，从所述历史断面潮流数据中提取训练样本。

【专利技术属性】
技术研发人员：刁瑞盛，史迪，张蓓，王司琪，段嘉俊，
申请(专利权)人：全球能源互联网研究院有限公司，国家电网有限公司，国网山西省电力公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人