基于微电网安全约束的电动汽车能量-计算资源调度方法技术

技术编号:39271685 阅读:8 留言:0更新日期:2023-11-07 10:51
本发明专利技术提供一种基于微电网安全约束的电动汽车能量

【技术实现步骤摘要】
基于微电网安全约束的电动汽车能量

计算资源调度方法


[0001]本专利技术涉及电力调度
,尤其涉及一种基于微电网安全约束的电动汽车能量

计算资源调度方法。

技术介绍

[0002]近年来,为了缓解环境污染,实现节能减排的目标,越来越多的可再生新能源以及电动汽车(electric vehicle,EV)进入到电力市场,发展新能源消纳与多能互补综合能源系统对电力产业向新能源体系快速转型意义重大。
[0003]相关技术中,由于园区微电网中的可再生能源产生的能量和电动汽车车主的出行需求存在不确定性,如何合理调度电动汽车的电量与算力资源,在保证电动汽车车主出行需求的情况下实现微电网内部的供需平衡,是本领域
技术人员亟需解决的技术问题。

技术实现思路

[0004]针对现有技术中的问题,本专利技术实施例提供一种基于微电网安全约束的电动汽车能量

计算资源调度方法、装置和设备。
[0005]具体地,本专利技术实施例提供了以下技术方案:
[0006]第一方面,本专利技术实施例提供了一种基于微电网安全约束的电动汽车能量

计算资源调度方法,包括:
[0007]建立基于MDP的第一目标模型;所述第一目标模型用于表示电动汽车采取不同动作时微电网所获得的奖励值;
[0008]将所述第一目标模型转换为基于CMDP的第二目标模型;所述第二目标模型用于确定目标策略;所述目标策略用于在目标时段内使得微电网的奖励值最大;
[0009]根据所述目标策略、微电网的状态信息和资源调度模型,确定电动汽车的资源调度策略;所述资源调度模型用于确定如何调度电动汽车的电量与算力资源。
[0010]进一步地,所述建立基于MDP的第一目标模型,所述第一目标模型用于表示电动汽车采取不同动作时微电网所获得的奖励值;包括:
[0011]利用如下公式建立第一目标模型:
[0012][0013]其中,表示微电网的总期望奖励值;r
t
表示微电网在t时段的奖励值;γ
t
表示折扣因子;π表示在状态s
t
下选择动作a的概率;τ表示轨迹(s0,a0,s1,

);ρ表示惩罚项系数;Penalty(π)表示惩罚函数。
[0014]进一步地,将所述第一目标模型转换为基于CMDP的第二目标模型,包括:
[0015]将第一目标模型转换为如下第二目标模型:
[0016][0017][0018]其中,示微电网的总期望奖励值;r
t
表示微电网在t时段的奖励值;γ
t
表示折扣因子;π表示在状态s
t
下选择动作a的概率;τ表示轨迹(s0,a0,s1,

);c
t
(s
t
,a
t
)表示辅助成本函数;d表示容忍度因子。
[0019]进一步地,基于拉格朗日乘子法和SAC算法,利用如下公式确定所述目标策略:
[0020][0021][0022][0023]其中,表示求解的目标策略;r
t
表示微电网在t时段的奖励值;γ
t
表示折扣因子;π表示在状态s
t
下选择动作a的概率;τ表示轨迹(s0,a0,s1,

);c
t
(s
t
,a
t
)表示辅助成本函数;d表示容忍度因子;β表示拉格朗日乘数。
[0024]进一步地,所述资源调度模型,包括:
[0025]上层调度模型;所述上层调度模型用于最小化T个时段内微电网的期望运行成本;
[0026]下层调度模型;所述下层调度模型用于最大化T个时段内电动汽车聚合服务商的收益。
[0027]进一步地,利用如下公式建立上层调度模型:
[0028][0029]其中,c
t
表示t时段微电网与大电网之间的能量交易成本,表示t时段微电网与大电网之间的交换功率;f1表示T个时段微电网的期望运行成本;
[0030]利用如下公式建立下层调度模型:
[0031][0032]其中,表示t时段第v辆电动汽车需要计算的任务数量,R
C
表示电动汽车完成单个计算任务,电动汽车聚合服务商获得的收益;f2表示T个时段电动汽车聚合服务商的收益。
[0033]进一步地,所述根据所述目标策略、微电网的状态信息和资源调度模型,确定微电网和电动汽车的资源调度策略,包括:
[0034]利用目标策略、微电网的状态信息和上层调度模型,确定微电网的最小购电成本和/或微电网对应的电动汽车充电站的充放电功率;
[0035]根据所述充电站的充放电功率和所述下层调度模型,确定各个电动汽车的充放电功率和计算任务数量。
[0036]第二方面,本专利技术实施例还提供了一种资源调度装置,包括:
[0037]建立模块,用于建立基于MDP的第一目标模型;所述第一目标模型用于表示电动汽车采取不同动作时微电网所获得的奖励值;
[0038]转换模块,用于将所述第一目标模型转换为基于CMDP的第二目标模型;所述第二目标模型用于确定目标策略;所述目标策略用于在目标时段内使得微电网的奖励值最大;
[0039]调度模块,用于根据所述目标策略、微电网的状态信息和资源调度模型,确定电动汽车的资源调度策略;所述资源调度模型用于确定如何调度电动汽车的电量与算力资源。
[0040]第三方面,本专利技术实施例还提供了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面所述基于微电网安全约束的电动汽车能量

计算资源调度方法。
[0041]第四方面,本专利技术实施例还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述基于微电网安全约束的电动汽车能量

计算资源调度方法。
[0042]第五方面,本专利技术实施例还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如第一方面所述基于微电网安全约束的电动汽车能量

计算资源调度方法。
[0043]本专利技术实施例提供的基于微电网安全约束的电动汽车能量

计算资源调度方法、装置和设备,基于马尔可夫决策过程MDP建立第一目标模型从而准确的对电动汽车采取不同动作时微电网所获得的奖励值进行表征;进而通过将基于MDP建立的第一目标模型扩展为基于CMDP建立的第二目标模型,并引入了约束的辅助成本函数,避免了基于MDP建立的第一目标模型中对于资源调度过程中惩罚系数的不确定性和复杂性,有效地减少搜索空间,从而基于CMDP建立的第二目标模型也就可以更加高效准确的确定使得在目标时段内微电网的奖励值最大本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于微电网安全约束的电动汽车能量

计算资源调度方法,其特征在于,包括:建立基于马尔可夫决策过程MDP的第一目标模型;所述第一目标模型用于表示电动汽车采取不同动作时微电网所获得的奖励值;将所述第一目标模型转换为基于约束马尔可夫决策过程CMDP的第二目标模型;所述第二目标模型用于确定目标策略;所述目标策略用于在目标时段内使得微电网的奖励值最大;根据所述目标策略、微电网的状态信息和资源调度模型,确定电动汽车的资源调度策略;所述资源调度模型用于确定如何调度电动汽车的电量与算力资源。2.根据权利要求1所述的基于微电网安全约束的电动汽车能量

计算资源调度方法,其特征在于,所述建立基于马尔可夫决策过程MDP的第一目标模型,所述第一目标模型用于表示电动汽车采取不同动作时微电网所获得的奖励值;包括:利用如下公式建立第一目标模型:其中,表示微电网的总期望奖励值;r
t
表示微电网在t时段的奖励值;γ
t
表示折扣因子;π表示在状态s
t
下选择动作a的概率;τ表示轨迹(s0,a0,s1,

);ρ表示惩罚项系数;Penalty(π)表示惩罚函数。3.根据权利要求2所述的基于微电网安全约束的电动汽车能量

计算资源调度方法,其特征在于,将所述第一目标模型转换为基于约束马尔可夫决策过程CMDP的第二目标模型,包括:将第一目标模型转换为如下第二目标模型:微电网安全约束如下:微电网安全约束如下:其中,示微电网的总期望奖励值;r
t
表示微电网在t时段的奖励值;γ
t
表示折扣因子;π表示在状态s
t
下选择动作a的概率;τ表示轨迹(s0,a0,s1,

);c
t
表示辅助成本函数;d表示容忍度因子;表示t时段微电网中各个母线电压的越限值;表示t时段微电网中各母线电流的越限值;表示t时段微电网与大电网交换功率的越限值。
4.根据权利要求3所述的基于微电网安全约束的电动汽车能量

计算资源调度方法,其特征在于,基于拉格朗日乘子法和SAC算法,利用如下公式确定所述目标策略:特征在于,基于拉格朗日乘子法和SAC算法,利用如下公式确定所述目标策略:特征在于,基于拉格朗日乘子法和SAC算法,利用如下公式确定所述目标策略:其中,表示求解的目标策略;r
t
表示微电网在t时段的奖励值;γ
t
表示折扣因子;π表示在状态s
t
下选择动作a...

【专利技术属性】
技术研发人员:王莉徐连明费爱国张宇明刘晓浒
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1