【技术实现步骤摘要】
一种基于强化学习的自适应优化储能方法
[0001]本专利技术属于电池储能优化调度
,具体涉及一种基于强化学习的自适应优化储能方法,可用于电力系统优化、微电网储能、工业工程、市政建设等多样化场景。
技术介绍
[0002]近年来,鉴于储能系统不断发展和完善,其所适用的电力系统领域由削峰填谷向频率调节、需求侧响应、供电可靠性分析、平抑新能源发电波动等各个方向发展,作为电力终端负荷削峰填谷十分良好的载体,可为工业企业用户节约电力成本,各地政府开始大力推荐储能系统应用,其商业前景广阔。因此,用户侧储能优化调度的研究备受关注。虽然储能优化调度有利于充分发挥能源系统的经济效益和环境效益,但是电力使用环境随机性和不确定性储能调度带来了极大的困难,为了更好地推广和使用储能系统,需要对储能进行优化调度以实现高效、经济稳定的运行。
[0003]传统的储能调度方式是基于数据综合分析并由人工进行调整的,整个储能调度的流程从数据分析到人工调整储能方案的闭环环节,如图1所示。可以看出,这个储能流程涉及用户、功能部门、储能系统以及能源交换设备等多个模块和部门,每个组成部分的业务不统一,相互之间交互不方便。储能规划时依据的环境信息和约束信息并非实时信息,存在一定滞后性。而且由于储能系统和供能方没有必要的联系,目前关于二者之间的工作流程也不完善,而有限的储能系统空闲资源在整个流程中起到了至关重要的作用,影响指令的下达和状态的反馈。整体上说,传统的储能规划流程可以完成对部分能量的响应,但已然是无法胜任新的需求与挑战。传统储能流程的弊端可总结 ...
【技术保护点】
【技术特征摘要】
1.一种基于强化学习的自适应优化储能方法,其特征在于,包括:S1:获取用户的电力数据,分析当前电力系统的用电情况,构建用户的需量计费模型;S2:结合所述需量计费模型,考虑约束条件,对当前用电情况下储能系统的经济效益进行分析和评估,得到储能系统初步分配方案;S3:根据所述储能系统初步分配方案,对储能动作参数进行预处理,并对各阶段储能系统动作策略进行粗分配;S4:将粗分配后的储能系统动作转变为动作序列并与每个时刻点对应,生成按照时间排序的储能系统调度序列;S5:根据当前环境特征,基于Q学习算法对所述储能系统调度序列进行动态的动作调整,以达到企业收益最优的目的。2.根据权利要求1所述的基于强化学习的自适应优化储能方法,其特征在于,所述需量计费模型以最大的投资收益率max(E/C)表示,其中,C表示用户安装储能系统的投资成本,E表示储能系统收益。3.根据权利要求1所述的基于强化学习的自适应优化储能方法,其特征在于,所述S2包括:S2.1:构建约束条件,所述约束条件包括储能负荷约束、储能系统容量约束和储能倍率约束,其中,储能负荷约束:储能系统容量约束:L
min,t
≤P
t
+δ
i,t
‑
ρ
i,t
≤L
max,t
储能倍率约束:E
max
=β*P
max
其中,δ
max
表示最大放电功率,ρ
max
表示最大充电功率,P
t
表示t时刻的储能负荷,S
t
表示t时刻的电池电量状态,L
min,t
、L
max,t
表示t时刻储能系统负荷最小值和最大值,E
max
表示储能系统容量,β表示储能充放电倍率,P
max
表示储能系统额定功率;S2.2:结合所述需量计费模型和所述约束条件,对当前用电情况下储能系统的经济效益进行分析和评估,得到储能系统初步分配方案。4.根据权利要求3所述的基于强化学习的自适应优化储能方法,其特征在于,所述S2.2包括:S2.21:初始化用电参数,包括额定功率、充放电功率、充放电倍率参数设置;S2.22:对用户一天之内各个时间段需要执行的充放电动作进行初始化,构成一天之内各个时间段内的充放电动作序列集合;S2.23:判断当前的动作序列是否满足由所述需量计费模型和所述约束条件构成的目标函数的期望值,若满足,则输出预规划序列,否则返回步骤S2.22。5.根据权利要求3所述...
【专利技术属性】
技术研发人员:邢立宁,蒋雪梅,李豪,郭泱泱,吕旷达,周宇,万方高,李济廷,宋彦杰,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。