System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及工业调度,具体来说,涉及一种面向激励驱动需求响应的柔性作业车间节能调度方法。
技术介绍
1、电能是制造业最常用的能源之一,随着可再生能源渗透率的提高和“产-销者”时代的到来,电网正面临日益增长的电力供需平衡挑战。为了实现从负荷侧缓解电力供需失衡的压力,能源感知调度的优化重心逐渐从消费水平转向了消费模式,而需求响应(dr)正是该过程的催化剂。
2、dr通常被分为两类:基于价格的方案(pbps)和基于激励的方案(ibps)。对于储能系统(ees)而言,引入pbps需要在调度决策时考虑不同时段的电力价格,通过降低电力成本间接达到削峰填谷的目的。相对应的,ibps下的调度方案需要根据电网削峰请求(通常出现在用电高峰或电网可靠性出现问题的时段)进行自主调整,进而从负荷削减水平中获取对应的经济回报。因此,pbps-ees可以看作用户为中心的模式。何时或以什么程度利用较低的电价完全取决于制造商自身,这种模式对电网运营的影响很难精准预测。相反,ibps-ees是电网为中心的模式。
3、在电网制定的dr信号的指导下,将需求侧资源作为额外的电力平衡手段,利用源荷互动提高了电网的可靠性和韧性。来自电力市场的统计数据也表明,在减少峰值负载方面ibps(93%)比pbps(7%)效果更好。
4、drps-ees对于工业可持续生产运营十分重要,但仍存在以下限制。一方面,现有的柔性作业车间节能调度主要考虑了pbps下生产和电能的协调,尤其是分时电价(tou)方案。这些研究中对电力系统运行特征的刻画是粗犷的(相
5、针对相关技术中的问题,目前尚未提出有效的解决方案。
技术实现思路
1、针对相关技术中的问题,本专利技术提出一种面向激励驱动需求响应的柔性作业车间节能调度方法,以克服现有相关技术所存在的上述技术问题。
2、为此,本专利技术采用的具体技术方案如下:
3、一种面向激励驱动需求响应的柔性作业车间节能调度方法,包括以下步骤:
4、s1、基于改进的异构析取图表示柔性作业车间的节能调度状态,并构建图强化学习模型;
5、s2、采用近端策略优化算法对图强化学习模型进行训练;
6、s3、基于训练好的图强化学习模型,根据生产任务及日前削峰邀请输出对应的调度方案;
7、其中,所述日前削峰邀请包括响应时间、削减要求及激励率;所述削减要求表示订阅激励驱动需求响应之前测量的历史电力负荷与此次邀请的削减阈值的差值。
8、进一步地,所述基于改进的异构析取图表示柔性作业车间的节能调度状态,并构建图强化学习模型包括以下步骤:
9、s11、构建利用改进的异构析取图来描述调度状态的马尔可夫决策过程模块,并设计马尔可夫决策过程模块的奖励函数;
10、s12、建立用于提取嵌入信息和选择调度动作的图神经网络调度器,其中,图神经网络调度器包括表示学习网络和策略学习网络;
11、s13、基于表示学习网络,实现改进的异构析取图的嵌入,并根据策略学习网络及嵌入结果选择调度动作;
12、s14、基于马尔可夫决策过程模块和图神经网络调度器,组成图强化学习模型。
13、进一步地,所述改进的异构析取图的图结构的表达式为:
14、
15、式中,表示工序节点集;表示机器节点集;表示连接弧集;表示弧集;
16、所述改进的异构析取图的原始特征包括工序节点原始特征、机器节点原始特征、析取弧原始特征及全局特征。
17、进一步地,所述设计马尔可夫决策过程模块的奖励函数包括:
18、定义包含多层级和多目标要素的奖励函数;
19、根据多层级要素,定义轨迹-动作双层奖励,其中,轨迹奖励为优化目标的实际值,动作奖励为相邻时间步预期优化目标的差值;
20、基于多目标要素,将面向激励驱动响应的柔性作业车间节能调度问题分解成n个标量优化子问题,并使用不同的权重向量λb,b∈[1,2,…,n]进行标识;
21、设定加权混合式的多目标聚合奖励函数,确定各子问题的奖励。
22、进一步地,所述设定加权混合式的多目标聚合奖励函数,确定各子问题的奖励包括:
23、利用切比雪夫方法定义动作奖励ract,基于加权和法建模轨迹奖励rtra,针对第b个子问题,时间步t的奖励函数的表达式为:
24、
25、式中,ω1和ω2分别表示轨迹奖励和动作奖励的权重;和分别表示第b个子问题在时间步t的轨迹奖励和动作奖励;tet(λb)表示第b个子问题在时间步t的切比雪夫值;objs表示优化目标个数;表示第b个子问题第g个目标的权重;fg(t)表示第g个目标在时间步的预测值;表示第g个目标的参考值;at表示时间步t的动作空间集合;表示工序节点集。
26、进一步地,所述基于表示学习网络,实现改进的异构析取图的嵌入包括:
27、基于元路径-边注意力,嵌入机器节点;基于异构注意力,嵌入工序节点;
28、使用多层感知机对图级特征ψ进行特征提取,将计算结果与节点级嵌入结果相加得到完整的图嵌入;
29、其中,完整的图嵌入的表达式为:
30、
31、式中,表示时间步t的完整图嵌入;oij表示工序节点;表示经过z次迭代的工序节点oij的最终嵌入;||表示级联运算符;表示机器节点集;mk表示机器节点;表示表示经过z次迭代的机器节点mk的最终嵌入;mlp表示多层感知机;θ表示mlp中各个神经元之间连接的权重和偏置参数。
32、进一步地,所述基于元路径-边注意力,嵌入机器节点包括:
33、在元路径邻居方面,将机器加工能力子图中析取弧及其连接的两个不同的机器节点与同一个工序节点组成的路径定义为一条元路径;在时间步t,与机器节点mk存在元路径连接关系的所有机器节点集合称为其元路径邻居利用图注意力嵌入基于元路径的邻居机器节点,得到嵌入机器节点mk的特征向量表达式为:
34、
35、式中,νk表示嵌入前机器节点mk的特征向量;metapathgat(vk)表示元路径注意力嵌入方法;θ1表示用于转化机器节点特征至指定本文档来自技高网...
【技术保护点】
1.一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述基于改进的异构析取图表示柔性作业车间的节能调度状态,并构建图强化学习模型包括以下步骤:
3.根据权利要求2所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述改进的异构析取图的图结构的表达式为:
4.根据权利要求2所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述设计马尔可夫决策过程模块的奖励函数包括:
5.根据权利要求4所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述设定加权混合式的多目标聚合奖励函数,确定各子问题的奖励包括:
6.根据权利要求2所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述基于表示学习网络,实现改进的异构析取图的嵌入包括:
7.根据权利要求6所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述基于
8.根据权利要求6所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述基于异构注意力,嵌入工序节点包括:
9.根据权利要求6所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述根据策略学习网络及嵌入结果选择调度动作包括:
10.根据权利要求1所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述采用近端策略优化算法对图强化学习模型进行训练包括以下步骤:
...【技术特征摘要】
1.一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述基于改进的异构析取图表示柔性作业车间的节能调度状态,并构建图强化学习模型包括以下步骤:
3.根据权利要求2所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述改进的异构析取图的图结构的表达式为:
4.根据权利要求2所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述设计马尔可夫决策过程模块的奖励函数包括:
5.根据权利要求4所述的一种面向激励驱动需求响应的柔性作业车间节能调度方法,其特征在于,所述设定加权混合式的多目标聚合奖励函数,确定各子问题的奖励包括:
6...
【专利技术属性】
技术研发人员:张玺,董欣存,葛茂根,芮章杰,扈静,凌琳,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。