System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种用于日前市场优化调度的系统及方法技术方案_技高网

一种用于日前市场优化调度的系统及方法技术方案

技术编号:40661998 阅读:9 留言:0更新日期:2024-03-18 18:55
本发明专利技术公开一种用于日前市场优化调度的系统,其包括环境组件、第一优化组件以及多个并行的第二优化组件。其中环境组件用于基于输入的储能系统的充电、放电功率以及约束参数计算收益并更新状态。第一优化组件基于第二优化组件的累计本地梯度更新第一、第二优化组件参数。第二优化组件基于奖励及更新后的状态确定累计本地梯度。第二优化组件的结构与第一优化组件相同,包括策略模块以及评估模块。其中策略模块用于根据状态确定动作,评估模块用于计算优势函数以更新策略模块,且策略模块及评估模块均包括残差结构。该系统可在储能系统的连续动作空间中寻找到最优的申报策略,实现最优充、放电功率的调度。

【技术实现步骤摘要】

本专利技术涉及储能调度,特别涉及一种用于日前市场优化调度的系统及方法


技术介绍

1、随着能源结构转型、以及诸如风力发电和太阳能发电等可再生能源的快速普及和发展,输出电量的不稳定性成为电力系统调度的一个挑战。储能系统作为一种调度资源,其一方面可以作为动态的电力储备,解决可再生能源的不确定性和间歇性给电力系统带来的挑战,另一方面还可以优化电力负荷曲线、平衡供应和需求之间的差距、减少电力系统的闲置和过载,从而提高电力系统的稳定性和可靠性。此外,储能系统还可以作为一种柔性资源参与电力现货市场调度,从而增加市场竞争,提高市场运行效率,为市场提供更多的能源选择,进而推动电力定价的合理性,保障市场的公正和透明性。

2、传统的储能调度优化模型通常需要依赖准确的环境模型和参数,例如系统的动力学模型、变量的约束条件等。在复杂的实际情况下,获取准确的环境模型往往是困难的,模型的不确定性可能导致调度结果的不准确性。同时传统的储能调度优化模型无法灵活地应对动态环境,如事先制定好的固定规则和参数不能及时适应环境的变化,再加上会受到大量人工的干预,因此其很难在不断变化的电力市场环境中学习并做出最优的调度决策,最终的效果往往会出现效率低下,且结果不准确的问题。

3、具体而言,现有的电力市场中的储能调度优化模型主要包括枚举法、数学优化算法与智能优化算法。其中枚举法也称为穷举法,是一种通过枚举所有可能情况来解决问题的方法。这种方法通常应用于问题规模较小或者可能的解决方案数量有限的情况。枚举法的基本思想是通过一个循环遍历所有可能的解,然后根据特定条件或者目标函数来判断解是否满足要求。枚举法简单易懂,适用于不太复杂的问题,并且能够得到确切的解答,但是在问题规模较大或可能的解决方案数量非常多的情况下,其时间复杂度往往会非常高,导致计算量过大甚至无法实现枚举法简单易实现,尤其是针对电力市场中的储能调度优化模型中变量是连续的问题,枚举所有可能的组合或解往往需要非常大的计算资源和时间,且不易实现。数学优化算法是最优化理论中的求解算法,主要包括线性规划法、非线性规划法以及混合整数线性规划法等。线性规划法是一种求解线性目标函数和线性约束条件下最优解的数学优化方法,它假设目标函数和约束条件都是线性的,并且变量是连续的实数。非线性规划法是一种用于求解非线性目标函数或非线性约束条件下最优解的数学优化方法。常见的非线性规划算法包括梯度下降法、拟牛顿法和全局优化算法等。混合整数线性规划法是一种求解同时包含线性目标函数、线性约束条件和整数变量的数学优化方法。线性规划法要求目标函数和约束条件都是线性关系,这限制了其在解决非线性问题上的应用,同时由于线性规划问题是连续的,可能存在多个具有相同目标函数值的最优解,这增加了问题的复杂性。非线性规划法通常需要提供一个初始点作为启动点,可能会存在依赖于初始点的局部最优解问题。如果初始点选择不合适,可能无法找到全局最优解。混合整数线性规划问题属于难度问题,意味着对于大规模问题,难以找到高效的准确解决方法,同时混合整数线性规划问题可能无法找到全局最优解,而只能获得近似解。智能优化算法是一类模拟自然界中生物界和社会行为的计算模型,通过不断地搜索解空间,逐渐朝着最优解进化。这类算法对于优化问题具有良好的鲁棒性,并能够自适应地调整搜索策略。如粒子群算法、遗传算法、模拟退火法、禁忌搜索法等。该方法是一种启发式算法,且依赖于随机性的搜索策略搜索过程,因此可能会陷入局部最优解,而无法找到全局最优解。同时,智能优化算法中的参数取值很大程度上决定了搜索的效果,而不同问题的最优参数取值是不同的,合适的参数设置对于算法的收敛速度和最终效果都有很大影响。


技术实现思路

1、针对现有技术中的部分或全部问题,本专利技术第一方面提供用于日前市场优化调度的系统,其通过引入强化学习算法中的异步优势动作评价算法(asynchronous advantageactor-critic,a3c)模型,结合策略学习以及值函数学习两种学习方式有效地调整储能系统的状态,从而实现自适应调度和优化控制,以合理利用资源、助力节能减排,所述系统包括:

2、环境组件(environment),其包括约束参数,所述环境组件用于基于输入的动作(action)以及所述约束参数计算奖励(reward)并更新状态,其中所述动作包括储能系统的充电、放电功率,以及所述奖励包括储能系统收益;

3、第一优化组件,其用于基于第二优化组件发送的累计本地梯度更新组件参数,并同步至各第二优化组件,所述第一优化组件包括第一策略模块(actor)以及第一评估模块(critic);

4、多个并行的第二优化组件,其中每个第二优化组件与所述第一优化组件可通信地连接,以将基于奖励及更新后的状态确定得到的累计本地梯度发送至所述第一优化组件,且每个第二优化组件的结构与所述第一优化组件相同,包括:

5、第二策略模块,其用于根据所述环境组件提供的状态(state)确定动作(action),其中所述第二策略模块包括残差结构;以及

6、第二评估模块,其用于基于所述奖励(reward)及更新的状态确定优势函数(advantage),并反馈至第二策略模块以更新所述第二策略模块,其中所述第二评估模块包括残差结构。

7、进一步地,所述环境组件的数量与所述第二优化组件相同。

8、进一步地,所述约束参数包括储能系统的最大能量值(state of charge,soc)、最小能量值、起始能量值、结束能量值、充电效率、放电效率、额定容量、充放电的最大功率值、充放电的最小功率值、储能系统进行满功率放电的时刻、输配电价、政府基金及附加、每日24个时刻点的日前出清价格、以及补偿价格。

9、进一步地,所述系统的初始化状态为一维列表,所述一维列表包括时刻t及所述时刻t对应的储能系统的能量状态。

10、进一步地,所述第一优化组件采用过往充、放电时刻出现的频率作为权重来更新所述组件参数。

11、基于如前所述的用于日前市场优化调度的系统,本专利技术第二方面提供一种用于日前市场优化调度的方法,包括:

12、确定环境组件的约束参数,其中所述环境组件包括n个相同的环境组件,n为电脑cpu的最大线程数;

13、构建并初始化优化组件,其中所述优化组件包括一个第一优化组件以及n个第二优化组件,所述n个第二优化组件与n个环境组件一一对应;

14、每个第二优化组件根据初始状态确定动作,并分别发送至与其对应的环境组件;

15、所述环境组件根据所述动作更新状态,并计算奖励值发送至第二优化组件;

16、所述第二优化组件更新累计本地梯度发送至所述第一优化组件,同时计算优势函数以更新策略模块;

17、所述第一优化组件根据各第二优化组件发送的累计本地梯度,更新组件参数并下发至所述第二优化组件;

18、基于更新后的参数更新所述第一优化组件及第二优化组件,并重复如前所述的动作确定至组件更新的本文档来自技高网...

【技术保护点】

1.一种用于日前市场优化调度的系统,其特征在于,包括

2.如权利要求1所述的系统,其特征在于,所述环境组件的数量与所述第二优化组件相同。

3.如权利要求1所述的系统,其特征在于,所述约束参数包括储能系统的最大能量值、最小能量值、起始能量值、结束能量值、充电效率、放电效率、额定容量、充放电的最大功率值、充放电的最小功率值、储能系统进行满功率放电的时刻、输配电价、政府基金及附加、每日24个时刻点的日前出清价格、以及补偿价格。

4.如权利要求1所述的系统,其特征在于,所述系统的初始化状态包括一维列表,所述一维列表包括时刻t及所述时刻t对应的储能系统的能量状态。

5.如权利要求1所述的系统,其特征在于,所述第一优化组件采用过往充、放电时刻出现的频率作为权重来更新所述组件参数。

6.一种用于日前市场优化调度的方法,其特征在于,采用如权利要求1至5任一所述的系统进行日前市场优化调度,所述方法包括步骤:

7.如权利要求6所述的方法,其特征在于,所述时刻t对应的储能系统的能量状态根据所述储能系统的t时刻的能量值与额定容量计算得到。

8.如权利要求6所述的方法,其特征在于,所述动作包括多个连续时刻的储能系统的充、放电功率值,其中所述充、放电功率值的精度为0.01。

9.如权利要求6所述的方法,其特征在于,所述奖励值根据如下公式计算得到:

10.如权利要求6所述的方法,其特征在于,所述迭代结束要求包括迭代次数达到预设值。

11.一种用于日前市场优化调度的电子设备,其特征在于,包括存储器以及处理器,其中所述存储器被配置为存储计算机程序,所述计算机程序在所述处理器运行时执行如权利要求1至10任一所述的日前市场优化调度的方法。

...

【技术特征摘要】

1.一种用于日前市场优化调度的系统,其特征在于,包括

2.如权利要求1所述的系统,其特征在于,所述环境组件的数量与所述第二优化组件相同。

3.如权利要求1所述的系统,其特征在于,所述约束参数包括储能系统的最大能量值、最小能量值、起始能量值、结束能量值、充电效率、放电效率、额定容量、充放电的最大功率值、充放电的最小功率值、储能系统进行满功率放电的时刻、输配电价、政府基金及附加、每日24个时刻点的日前出清价格、以及补偿价格。

4.如权利要求1所述的系统,其特征在于,所述系统的初始化状态包括一维列表,所述一维列表包括时刻t及所述时刻t对应的储能系统的能量状态。

5.如权利要求1所述的系统,其特征在于,所述第一优化组件采用过往充、放电时刻出现的频率作为权重来更新所述组件参数。

6.一种用于日前市场优化调度的方法...

【专利技术属性】
技术研发人员:沈山山谭江浩罗益军徐峰李志勇石良君
申请(专利权)人:广州汇电云联数科能源有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1