基于马尔可夫决策链的电力市场实时电价优化方法技术

技术编号:31504036 阅读:15 留言:0更新日期:2021-12-22 23:31
本发明专利技术涉及电价优化技术领域,具体涉及基于马尔可夫决策链的电力市场实时电价优化方法,包括以下步骤:S1:通过马尔科夫链建立有限阶段实时电价模型;S2:建立所有工业园区用户和供电商在时段t内的总报酬值;S3:工业园区用户与供电商所代表的需求侧和供应侧效用之和最大化的实时电价优化模型,并采用粒子群法进行优化。本发明专利技术通过马尔科夫链决策过程对这种双向影响以及用户用电状态的转移性进行描述,形成工业园区用户的用电特征;考虑用户用电和供电商供电的前后关联性,以社会福利最大化为目标建立数学模型,最后利用粒子群算法对马尔可夫链建立的模型进行求解,得出实时电价的策略优势。略优势。略优势。

【技术实现步骤摘要】
基于马尔可夫决策链的电力市场实时电价优化方法


[0001]本专利技术涉及电价优化
,具体涉及基于马尔可夫决策链的电力市场实时电价优化方法。

技术介绍

[0002]近几年来国内外一些学者对实时电价进行了大量研究,在上网电价、输电定价和辅助服务定价等方面进行了大量研究。求解实时电价定价问题主要围绕以供电商供电成本最小、用户总效用最大为目标的社会福利最大化模型,从全社会角度来看,社会福利最大化模型能充分调动用户参与电力运行的积极性.很多学者所提出的实时电价模型基础上,考虑不同情况得到了一些扩展形式.将原有的优化模型中的二次效用函数替换为对数效用函数,利用对偶次梯度算法进行求解。G.Asadi,M.Gitizadeh and A.Roosta,"Welfare maximizationunder real

time pricing in smart grid using PSO algorithm,"考虑了相同供应商对应不同需求侧类型的情况,需求侧分为商业用户和居民用户,不同类型用户的电价不同;L.P.Qian,Y.J.A.Zhang,J.Huang and Y.Wu,"DemandResponse Management via Real

Time Electricity Price Control in SmartGrids,"加入常用家具电器的影响,考虑多阶段的社会福利最大化模型。
[0003]上述提到的研究大多忽略了用户用电以及供电商供电的前后关联性实时电价的优势没有被完美展现,也都没有给出应用于工业园区的技术方案。

技术实现思路

[0004]为了解决上述问题,本专利技术提供了基于马尔可夫决策链的电力市场实时电价优化方法,具体技术方案如下:
[0005]基于马尔可夫决策链的电力市场实时电价优化方法,包括以下步骤:
[0006]S1:通过马尔科夫链建立有限阶段实时电价模型;
[0007]S2:计算所有工业园区用户和供电商在时段t内的总报酬值;
[0008]S3:建立工业园区用户与供电商所代表的需求侧和供应侧效用之和最大化的实时电价优化模型,并采用粒子群法进行优化,得到最优的实时电价。
[0009]优选地,所述步骤S1中用马尔可夫决策链过程表示如下:
[0010]{T,S
t
,R
t
,p
t
(S
t+1
|S
t
,R
t+1
),F
t
(S
t
,R
t
)};
ꢀꢀ
(1)
[0011]其中各符号定义如下:T为决策时段,即一天中的决策时段:
[0012]T={1,2,3,4,

,N},N<


ꢀꢀ
(2)
[0013]S
t
为工业园区用户在t时段的用电负荷量,即用电量:
[0014]S
t
=[0,s],s<


ꢀꢀ
(3)
[0015]R
t
为电价制定商在t时段时可用的电价定价:
[0016]R
t
=[0,r],0≤R
t
≤r;
ꢀꢀ
(4)
[0017]p
t
(S
t+1
|S
t
,R
t+1
)为转移概率,即工业园区用户根据t+1时段的电价R
t+1
和时段t的用
电量决定t+1时段的用电量S
t+1
的概率,在假设条件下可认为每个时间段的用电相互独立,即上一时间段的用电状态并不对本时间段用电产生影响,故影响因素只归因于本时间段的电价,因此,其概率分布为:
[0018][0019][0020]这里是一组s*r的矩阵,其中P
ij
表示在电价j时工业园区用户用电负荷为i的概率。
[0021]优选地,所述步骤S2中总报酬值设为F
t
(S
t
,R
t
)的计算方式:
[0022]采用工业园区用户的用电效用减去发电成本作为总报酬值,具体如下:
[0023][0024]其中,U(ω
q
,S
t
)是工业园区用户用电的效用函数;Q是工业园区用户数量, q∈[1,Q],q是整数;S
t
是工业园区用户在t时段的用电负荷量,即用电量;ω
q
表示工业园区用户的购电意愿;C
t
(L)是发电成本。
[0025]优选地,所述U(ω
q
,S
t
)函数满足:
[0026][0027][0028]优选地,发电成本C
t
(L)是关于用电负荷的成本函数,其形式如下:
[0029]C
t
(L)=a
t
L2+b
t
L+c
t

ꢀꢀ
(10)
[0030]其中,a
t
>0,而b
t
≥0,c
t
≥0,L是该S决策时段总的用电负荷,即同一时段,所有工业园区用户的用电负荷之和;S=S1+S2+...+S
t

[0031]优选地,对于T≥0,策略电价R
t
下的N阶期望总效用函数是:
[0032][0033]其中,V
N
(S,R)为统计时段的总效用值,q表示第q工业园区用户,[F
t
(S
t
,R
t
)]表示时段t时刻的工业园区用户q的用电期望报酬值;F
t
(S
N
)是过程的终止报酬,一般为零。
[0034]优选地,所述实时电价优化模型,目标函数如下:
[0035][0036][0037]L
t
是时段t的所有工业园区用户的用电负荷,是t时段工业园区用户q的用电负荷,和分别是时段t的最小负荷和最大负荷;和分别是工业园区用户q在时段t时刻的最小负荷和最大负荷,Q是工业园区用户的总数。
[0038]优选地,所述粒子群算法中粒子位置转移公式为:
[0039]R
k+1
=R
k
+V
k

ꢀꢀ
(14)
[0040]式中,k是迭代次数,R
k+1
是第k+1代的电力价格,R
k
是第k代的电力价格, V
k
是粒子转移速度;
[0041]V
k+1
=C1V
k
+C2(R
best...

【技术保护点】

【技术特征摘要】
1.基于马尔可夫决策链的电力市场实时电价优化方法,其特征在于:包括以下步骤:S1:通过马尔科夫链建立有限阶段实时电价模型;S2:计算所有工业园区用户和供电商在时段t内的总报酬值;S3:建立工业园区用户与供电商所代表的需求侧和供应侧效用之和最大化的实时电价优化模型,并采用粒子群法进行优化,得到最优的实时电价。2.根据权利要求1所述的基于马尔可夫决策链的电力市场实时电价优化方法,其特征在于:所述步骤S1中用马尔可夫决策链过程表示如下:{T,S
t
,R
t
,p
t
(S
t+1
|S
t
,R
t+1
),F
t
(S
t
,R
t
)};
ꢀꢀꢀꢀ
(1)其中各符号定义如下:T为决策时段,即一天中的决策时段:T={1,2,3,4,

,N},N<


ꢀꢀꢀ
(2)S
t
为工业园区用户在t时段的用电负荷量,即用电量:S
t
=[0,s],s<


ꢀꢀꢀ
(3)R
t
为电价制定商在t时段时可用的电价定价:R
t
=[0,r],0≤R
t
≤r;
ꢀꢀꢀ
(4)p
t
(S
t+1
|S
t
,R
t+1
)为转移概率,即工业园区用户根据t+1时段的电价R
t+1
和时段t的用电量决定t+1时段的用电量S
t+1
的概率,在假设条件下可认为每个时间段的用电相互独立,即上一时间段的用电状态并不对本时间段用电产生影响,故影响因素只归因于本时间段的电价,因此,其概率分布为:概率分布为:这里是一组s*r的矩阵,其中P
ij
表示在电价j时工业园区用户用电负荷为i的概率。3.根据权利要求1所述的基于马尔可夫决策链的电力市场实时电价优化方法,其特征在于:所述步骤S2中总报酬值设为F
t
(S
t
,R
t
)的计算方式:采用工业园区用户的用电效用减去发电成本作为总报酬值,具体如下:其中,U(ω
q
,S
t
)是工业园区用户用电的效用函数;Q是工业园区用户数量,q∈[1,Q],q是整数;S
t
是工业园区用户在t时段的用电负荷量,即用电量;ω
q
表示工业园区用户的购电意愿;C
t
(L)是发电成...

【专利技术属性】
技术研发人员:韩帅卢健斌郭小璇孙乐平杨艺云肖静吴宛潞秦丽娟陈卫东吴宁
申请(专利权)人:广西电网有限责任公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1