训练、策略生成方法、系统、计算机装置及存储介质制造方法及图纸

技术编号:29792181 阅读:18 留言:0更新日期:2021-08-24 18:11
本申请提供训练、策略生成方法、系统、计算机装置及存储介质,通过端到端的深度学习框架来进行产能控制策略的生成;其中,在训练该深度学习框架时,令所述深度学习框架接收需能量相关数据集的输入,以输出至少一时隙的产能控制策略;令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失,通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。通过深度学习框架确定依据预测产能量的产能控制策略,令预测更为准确;并且通过深度学习框架的端到端学习能有效提升运算效率。

【技术实现步骤摘要】
训练、策略生成方法、系统、计算机装置及存储介质
本申请涉及能源管理
,特别是涉及训练、策略生成方法、系统、计算机装置及存储介质。
技术介绍
可再生能源的日益普及挑战了传统的能量产生系统(如电力系统,包含发电机、发电机组等)的运行模式,相应的,设计对能量产生系统的能量产生行为的控制策略并执行的行为,俗称经济调度(ED)也愈发困难。其难点在于,需要对负载(LOAD)的用能需求进行预测,而短期负荷预测可能相当准确,因此,基于这些预测的调度产生的发电成本几乎为最小。但是,当可再生能源发电被视为负负载时,其随机性使净负载难以预测。现有的负载预测技术采用的预测精度的度量标准是均方误差(MSE),并且该度量指标通常与ED的目标函数不一致,存在预测不准确、并不降低成本等问题。并且,良好的ED策略实现的主要困难来自时间耦合和动态实现。为了解决时间挑战,解决方案的概念从经典的线性和二次规划到用于值点加载的遗传算法不等。为了克服动态调度的困难,已经提出了各种数学规划方法,包括Lambda迭代方法,内部点方法和动态规划等。但是,这些方法通常很耗时,即运算效率低下,及时性差,不适用于大规模的能量产生系统。
技术实现思路
鉴于以上所述现有相关的缺点,本申请的目的在于提供训练、策略生成方法、系统、计算机装置及存储介质,用于解决现有技术中对能量产生系统的能量产生行为的控制策略存在的种种弊端。为实现上述目的及其他相关目的,本申请的第一方面提供一种训练方法,用于训练深度学习框架,所述深度学习框架能生成用于控制能量产生系统在至少一时隙的产能控制策略;其中,所述能量产生系统包括一或多个能量产生装置,以至少令对应所述产能控制策略的所述能量产生系统的预测产能量满足同一时隙的用能系统的实际需能量;所述训练方法包括:令所述深度学习框架接收需能量相关数据集的输入,以输出至少一时隙的产能控制策略;令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失,通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。在本申请第一方面的某些实施例中,所述深度学习框架包括:负载预测器,用于根据需能量相关数据集预测该至少一时隙的需能量的概率分布信息;策略生成器,用于根据所述概率分布信息获得所述产能控制策略;所述更新所述深度学习框架的模型参数,包括:更新所述负载预测器的模型参数。在本申请第一方面的某些实施例中,所述深度学习框架包括:产能预测器,用于根据需能量相关数据集预测所述预测产能量的信息,以用于生成产能控制策略;所述更新所述深度学习框架的模型参数,包括:更新所述产能预测器的模型参数。在本申请第一方面的某些实施例中,所述需能量相关数据集包括:一或多组单元数据,每组单元数据包括:在先时间的历史需求状态参数、及历史实际需能量。在本申请第一方面的某些实施例中,所述需能量相关数据集中的部分作为训练集,另一部分作为测试集。在本申请第一方面的某些实施例中,所述深度学习框架根据相关于产能量的产能成本、和/或产能量相对预测需能量短缺和/或超出情形下的供需误差量符合最小化条件以获得所述预测产能量。在本申请第一方面的某些实施例中,符合最小化条件的所述产能成本的函数是通过在产能量的预设取值范围中执行分段线性函数的建立方法来得到的。在本申请第一方面的某些实施例中,所述供需误差量根据预测产能量在相对于已知概率密度分布的预测需能量短缺和/或超出情形下得到的累积概率分布与相应系数所表示。在本申请第一方面的某些实施例中,所述预测产能量位于产能量限制范围中;其中,所述产能量限制范围的边界值与能量产生系统的产能限制相关。在本申请第一方面的某些实施例中,所述产能量限制范围的边界还与能量产生系统的线路传输能量限制相关。在本申请第一方面的某些实施例中,所述预测产能量是在所述产能量限制范围上采用步进递减至预设阈值的查询方式所查询得到的,所述步进的方向由所述产能成本和/或供需误差量的函数随预测产能量变化而单调增加或单调递减所确定。在本申请第一方面的某些实施例中,在所查询到的预测产能量位于所述产能量限制范围以外时,以最接近的所述边界值作为预测产能量。在本申请第一方面的某些实施例中,所述匹配损失包括:成本损失及供需误差损失中的一种或多种组合。在本申请第一方面的某些实施例中,所述成本损失包括:预测产能成本及实际需能成本间的偏差;所述预测产能成本为能量产生系统生产一预测产能量的总生产成本;所述实际需能成本等同于该预测产能量满足实际需能量情形下达成的所述总生产成本的最小值。在本申请第一方面的某些实施例中,所述供需误差损失包括:预测产能量相对实际需能量短缺和/或超出情形下产生的损失。在本申请第一方面的某些实施例中,所述产能控制策略的生成方式,包括:通过分解函数处理所述预测产能量得到对所述一或多个能量产生装置的能量产生动作,以形成所述产能控制策略;其中,所述分解函数的获取依据包括能量产生系统的产能限制。在本申请第一方面的某些实施例中,所述分解函数的获取依据还包括:能量产生系统的线路传输能量限制。在本申请第一方面的某些实施例中,所述产能控制策略的生成方式,包括:以所述预测产能量作为产能控制策略。为实现上述目的及其他相关目的,本申请的第二方面提供一种产能控制策略生成方法,包括:令深度学习框架接收需能量相关数据集,以输出至少一时隙的产能控制策略;其中,所述深度学习框架是由如第一方面中任一项所述的训练方法所训练得到的。为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机装置,包括:存储装置,用于存储至少一程序;处理装置,通信连接所述存储装置,用于调用所述至少一程序,以执行如第一方面中任一项所述的训练方法。为实现上述目的及其他相关目的,本申请的第四方面提供一种计算机装置,包括:存储装置,用于存储至少一程序;处理装置,通信连接所述存储装置,用于调用所述至少一程序,以执行如第二方面所述的产能控制策略生成方法。为实现上述目的及其他相关目的,本申请的第五方面提供一种能量生成系统;所述能量生成系统包括或通信连接于如第四方面所述的计算机装置以获取对应该至少一时隙的产能控制策略;所述能量生成系统包括:一或多个能量产生装置,用于在该至少一时隙执行由所述产能控制策略所确定的能量产生动作。为实现上述目的及其他相关目的,本申请的第六方面提供一种计算机存储介质,存储有至少一计算机程序,所述至少一计算机程序被运行时执行如第一方面中任一项所述的训练方法;或者,执行如第二方面所述的产能控制策略生成方法。如上所述,鉴于MSE不是评估进行ED的负载预测性能的理想选择,本申请提供训练、策略生成方法、系统、计算机装置及存储介质,通过端到端的深度学习框架来进行产能控制策略的生成;其中,在训练该深度学习框架时,令所述深度学习框架接收需能量相关数据集的输入,以输出至少一时隙的产能控制策略;令产能控制策略输入损失函数本文档来自技高网...

【技术保护点】
1.一种训练方法,其特征在于,用于训练深度学习框架,所述深度学习框架能生成用于控制能量产生系统在至少一时隙的产能控制策略;其中,所述能量产生系统包括一或多个能量产生装置,以至少令对应所述产能控制策略的所述能量产生系统的预测产能量满足同一时隙的用能系统的实际需能量;所述训练方法包括:/n令所述深度学习框架接收需能量相关数据集的输入,以输出至少一时隙的产能控制策略;/n令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失,通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。/n

【技术特征摘要】
1.一种训练方法,其特征在于,用于训练深度学习框架,所述深度学习框架能生成用于控制能量产生系统在至少一时隙的产能控制策略;其中,所述能量产生系统包括一或多个能量产生装置,以至少令对应所述产能控制策略的所述能量产生系统的预测产能量满足同一时隙的用能系统的实际需能量;所述训练方法包括:
令所述深度学习框架接收需能量相关数据集的输入,以输出至少一时隙的产能控制策略;
令产能控制策略输入损失函数得到基于该至少一时隙的产能控制策略形成的预测产能量和实际需能量间的匹配损失,通过相应的误差反馈以更新所述深度学习框架的模型参数以限制所述匹配损失。


2.根据权利要求1所述的训练方法,其特征在于,所述深度学习框架包括:负载预测器,用于根据需能量相关数据集预测该至少一时隙的需能量的概率分布信息;策略生成器,用于根据所述概率分布信息获得所述产能控制策略;
所述更新所述深度学习框架的模型参数,包括:
更新所述负载预测器的模型参数。


3.根据权利要求1所述的训练方法,其特征在于,所述深度学习框架包括:产能预测器,用于根据需能量相关数据集预测所述预测产能量的信息,以用于生成产能控制策略;
所述更新所述深度学习框架的模型参数,包括:
更新所述产能预测器的模型参数。


4.根据权利要求1所述的训练方法,其特征在于,所述需能量相关数据集包括:一或多组单元数据,每组单元数据包括:在先时间的历史需求状态参数、及历史实际需能量。


5.根据权利要求1所述的训练方法,其特征在于,所述需能量相关数据集中的部分作为训练集,另一部分作为测试集。


6.根据权利要求1所述的训练方法,其特征在于,所述深度学习框架根据相关于产能量的产能成本、和/或产能量相对预测需能量短缺和/或超出情形下的供需误差量符合最小化条件以获得所述预测产能量。


7.根据权利要求6所述的训练方法,其特征在于,符合最小化条件的所述产能成本的函数是通过在产能量的预设取值范围中执行分段线性函数的建立方法来得到的。


8.根据权利要求6所述的训练方法,其特征在于,所述供需误差量根据预测产能量在相对于已知概率密度分布的预测需能量短缺和/或超出情形下得到的累积概率分布与相应系数所表示。


9.根据权利要求6所述的训练方法,其特征在于,所述预测产能量位于产能量限制范围中;其中,所述产能量限制范围的边界值与能量产生系统的产能限制相关。


10.根据权利要求9所述的训练方法,其特征在于,所述产能量限制范围的边界还与能量产生系统的线路传输能量限制相关。


11.根据权利要求9所述的,其特征在于,所述预测产能量是在所述产能量限制范围上采用步进递减至预设阈值的查询方式所查询得到的,所述步进的方向由所述产能成本和/或供需误差量的函数随预测产能量变化而单调增加或单调递减所确定。


12.根据权利要求11所述的训练方法,其特征在于,在所查询到的预测产能量位于所述产能量限制范围以外时,以最接近的所述边界值作为预测产能量。


13.根据权利要求1或6所述的训练方法,其特征在于,所述匹配损失包括:成本损失及供需误差损失中的一种或多种组合。

【专利技术属性】
技术研发人员:卢晨贝
申请(专利权)人:中关村海华信息技术前沿研究院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1