System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于智能电网能源管理,具体涉及一种异构多智能体协作的综合园区电力能源调度方法及系统。
技术介绍
1、随着我国产业结构的持续调整与智慧建筑领域的迅猛进步,园区作为能源消耗的重要场所,其建设规模不断扩张,电力能源需求也随之急剧攀升。园区电力能源系统是一个复杂庞大的体系,涵盖了光伏发电系统、储能装置、市政电网接入点以及电动汽车充电桩等多种能源组件,共同构成了一个微电网系统。当前,在确保园区内部用户用电需求得到满足并维持用电舒适度的前提下,如何以高效、经济且环保的方式管理这一多元化的能源系统,已成为亟待解决的核心挑战。
2、传统的园区电力能源系统调度策略主要依赖于固定的模型和算法,这难以全面考虑各子系统间的动态交互以及实时变化的工作环境。面对复杂多变的能源需求,这种静态的调度模式往往难以确保整体能源利用效率的最大化,甚至可能引发能源浪费和运营成本的增加。特别是在包含光伏发电、储能以及电动汽车充电桩等具有异构特性的能源系统中,由于这些组件的运行状态和决策过程相互依存,传统的调度方法更是显得力不从心。
技术实现思路
1、针对传统的园区电力能源系统调度策略面对复杂多变的能源需求,这种静态的调度模式往往难以确保整体能源利用效率的最大化,甚至可能引发能源浪费和运营成本的增加的问题,本专利技术提供一种异构多智能体协作的综合园区电力能源调度方法及系统。
2、第一方面,本专利技术技术方案提供一种异构多智能体协作的综合园区电力能源调度方法,包括如下步骤:
3、通
4、利用因果关系图谱以及条件互信息量化方法,建立智能体之间情境依赖因果联系的模型;即多智能体因果图模型;
5、进行智能体之间的因果干预采集和条件互信息计算;
6、衡量各智能体之间的因果关系构建各智能体的内在奖励机制;
7、基于各智能体的内在奖励机制结合每个智能体在环境中的直接收益参数设计各智能体总奖励函数;
8、基于各智能体总奖励函数进行策略优化,输出相应的调度策略;
9、根据所述调度策略执行相应的控制动作实现整个园区电力能源的调度。
10、作为本专利技术技术方案的优选,通过分析各能源系统的特性和运行状况定制相应的异构智能体的步骤包括:
11、构建光伏发电系统智能体;所述光伏发电系统智能体通过日照强度和时间生成电力;通过设置光伏发电系统智能体的状态空间、动作空间和环境奖励函数最大化电力生成;
12、构建储能系统智能体;所述储能系统智能体根据电网的峰谷电价、负荷需求以及电池的充电状态来优化充放电策略;设置储能系统智能体的状态空间、动作空间和环境奖励函数;
13、构建汽车充电桩系统智能体;所述汽车充电桩系统智能体根据电动车的充电需求、电网电价及储能电池的充电状态,决定电力的来源以及充电或放电的操作;设置汽车充电桩系统智能体的状态空间、动作空间和环境奖励函数。
14、作为本专利技术技术方案的优选,光伏系统智能体的状态空间为:
15、
16、光伏系统智能体的动作空间为根据实时的太阳辐射强度和天气状况调整光伏系统的发电功率,最大化电力输出;
17、
18、光伏系统智能体的环境奖励函数是基于其所发电的电力量和对电网的依赖程度;
19、
20、式中,为当前时间t的太阳辐射强度,当前光伏系统的发电功率,光照时间;表示太阳辐射的可能遮挡情况, 0 表示完全遮挡,1表示无任何遮挡;为时刻t的电网电价;为光伏发电的最小输出功率,为光伏系统的最大额定功率,为光伏发电的输出功率;为光伏系统在时刻t产生的电力。
21、作为本专利技术技术方案的优选,多智能体因果图模型中,节点用来表示每个智能体i在t时刻的状态、动作和t+1时刻状态;状态节点描述该智能体对当前环境的感知,动作节点描述该智能体的决策行为;边用来表示多异构智能体间的因果关系,即某个智能体的状态或动作对其他智能体的状态或动作产生影响,边的方向表明了因果关系的流向。
22、作为本专利技术技术方案的优选,进行智能体之间的因果干预采集和条件互信息计算的步骤包括:
23、通过计算条件互信息来量化一个系统的动作对其他系统状态的依赖程度;
24、光伏系统当前状态下,其动作对储能系统下一状态的因果影响强度的条件互信息公式如下:
25、
26、其中,公式的左侧是条件互信息的近似值,表示一个神经网络。
27、作为本专利技术技术方案的优选,衡量各智能体之间的因果关系构建各智能体的内在奖励机制的步骤包括:基于计算得到的因果影响强度,构建内在奖励机制,具体包括:
28、光伏系统的动作对储能系统和充电桩系统产生正向因果影响且因果影响强度大于第一设定值时则给予光伏系统内在奖励;来最大化光伏系统对其他系统的激励;
29、储能系统的动作对充电桩系统的需求满足率产生正向影响且因果影响强度大于第二设定值时,则为储能系统分配内在奖励,来选择对充电桩系统最有利的充放电策略;
30、充电桩系统的行为对电网或储能系统的负荷管理产生正向因果影响时,为充电桩系统提供内在奖励,来优化其对系统负荷的支持。
31、作为本专利技术技术方案的优选,基于各智能体的内在奖励机制结合每个智能体在环境中的直接收益参数设计各智能体总奖励函数的步骤中,具体包括:
32、光伏系统的总奖励函数:
33、
34、储能系统的总奖励函数:
35、
36、储能系统的总奖励函数:
37、
38、其中,、和分别表示每个系统在环境中的直接收益;为调整因果影响奖励的权重系数,其参考值均在[0-1]之间,可根据实际各系统间的协作程度调整。
39、作为本专利技术技术方案的优选,基于各智能体总奖励函数进行策略优化输出相应的调度策略的步骤包括:
40、基于各智能体总奖励函数设计系统总奖励函数;
41、并考虑到电费支出,本专利将其作为惩罚项引入到总体优化目标函数中;
42、通过最大化每个智能体的总奖励,使用ppo的目标函数进行策略优化输出优化后的调度策略。
43、系统总奖励函数。
44、作为本专利技术技术方案的优选,通过最大化每个智能体的总奖励,使用ppo的目标函数进行策略优化输出优化后的调度策略的步骤中,系统的整体优化目标函数:
45、
46、
47、整个系统的电费支出如上式所示。具体而言,表示储能系统从电网购买的电力成本减去储能系统向电网出售的电力收入;表示光伏系统向电网出售的电力带来的收益;表示充电桩从电网购买电力的成本减去其向电网出售电力的收入;表示实时电价。
48、对于每种智能体i,使用ppo的目标函数进行优化;
49、策略更新目标函数:本文档来自技高网...
【技术保护点】
1.一种异构多智能体协作的综合园区电力能源调度方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,通过分析各能源系统的特性和运行状况定制相应的异构智能体的步骤包括:
3.根据权利要求2所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,光伏系统智能体的状态空间为:
4.根据权利要求3所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,多智能体因果图模型中,节点用来表示每个智能体i在t时刻的状态、动作和t+1时刻状态;状态节点描述该智能体对当前环境的感知,动作节点描述该智能体的决策行为;边用来表示多异构智能体间的因果关系,即某个智能体的状态或动作对其他智能体的状态或动作产生影响,边的方向表明了因果关系的流向。
5.根据权利要求4所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,衡量各智能体之间的因果关系构建各智能体的内在奖励机制的步骤包括:基于计算得到的因果影响强度,构建内在奖励机制,具体包括:
6.根据权利要求5所述的异构多智能
7.根据权利要求6所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,基于各智能体总奖励函数进行策略优化输出相应的调度策略的步骤包括:
8.根据权利要求7所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,通过最大化每个智能体的总奖励,使用PPO的目标函数进行策略优化输出优化后的调度策略的步骤中,系统的整体优化目标函数:
9.一种异构多智能体协作的综合园区电力能源调度系统,其特征在于,包括异构智能体构建模块,所述异构智能体构建模块连接有智能体因果图模型模块、内在奖励设计模块和总奖励计算及策略优化模块;智能体因果图模型模块通过因果关系采样及条件互信息计算模块与内在奖励设计模块连接;
10.根据权利要求9所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,该系统还包括调度执行模块,用于根据所述调度策略执行相应的控制动作实现整个园区电力能源的调度。
...【技术特征摘要】
1.一种异构多智能体协作的综合园区电力能源调度方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,通过分析各能源系统的特性和运行状况定制相应的异构智能体的步骤包括:
3.根据权利要求2所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,光伏系统智能体的状态空间为:
4.根据权利要求3所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,多智能体因果图模型中,节点用来表示每个智能体i在t时刻的状态、动作和t+1时刻状态;状态节点描述该智能体对当前环境的感知,动作节点描述该智能体的决策行为;边用来表示多异构智能体间的因果关系,即某个智能体的状态或动作对其他智能体的状态或动作产生影响,边的方向表明了因果关系的流向。
5.根据权利要求4所述的异构多智能体协作的综合园区电力能源调度方法,其特征在于,衡量各智能体之间的因果关系构建各智能体的内在奖励机制的步骤包括:基于计算得到的因果影响强度,构建内在奖励机制,具体包括:
6.根据权利要求5所述的异构...
【专利技术属性】
技术研发人员:孙浩,李亮,张彦玉,高宏杰,
申请(专利权)人:山东浪潮智慧建筑科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。