System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电力交易,更具体的,涉及一种基于多目标参数权重的电力交易优化决策方法及系统。
技术介绍
1、随着国家电力体系改革,激发市场活力,参与电力市场交易的主体越来越多,意愿越来越强,交易策略的制定怎样不依赖于人的意志,最大程度让用电企业用电成本下降(与传统电网公司直接买电对比)是要解决的事情;这个决策是个复杂的系统,现在多目标选取时如:交易成本(cost)、供需平衡度(balance)、能源环保得分(eco-score)、交易效率(efficiency)的选取时现在都是基于经验判断,或主观进行,导致最终对电价、策略的制定存在主观性,无法做到公平公正。
2、因此,现有技术存在缺陷,亟待改进。
技术实现思路
1、鉴于上述问题,本专利技术的目的是提供一种基于多目标参数权重的电力交易优化决策方法及系统,能够避免人员干预,让电力交易策略制定更有信任度。
2、本专利技术第一方面提供了一种基于多目标参数权重的电力交易优化决策方法,包括:
3、获取电力市场的交易数据;
4、将电力市场的交易数据进行预处理,得到交易样本数据;
5、将交易样本数据发送至预设的电力市场环境模型,得到当前电力市场的交易决策。
6、本方案中,所述预设的电力市场环境模型的构建步骤,具体包括:
7、将预设的初始化模型划分为目标网络模块、主网络模块和智能体模块;
8、获取电力市场的历史交易数据;
9、将电力市场的历史交
10、将训练样本发送至目标网络模块和主网络模块,得到损失函数值;
11、若损失函数值小于等于预设第一阈值,则训练结束,并提取对应的参数权重系数;
12、将所述参数权重系数发送至智能体模块以进行存储。
13、本方案中,还包括:
14、若损失函数大于预设第一阈值,根据损失函数确定主网络参数的梯度,并基于梯度下降法更新主网络的参数,将主网络的参数设为θq,其公式为其中θ′q表示主网络的调整参数,k是学习率,表示损失函数l关于主网络参数的梯度;通过主网络的调整参数对主网络的参数进行替换。
15、本方案中,还包括:
16、当损失函数大于预设第一阈值时,提取初始化模型在训练时迭代计算的次数值;
17、判断迭代计算的次数值是否大于等于预设次数阈值,若是,训练结束,并提取对应的参数权重系数;
18、将所述参数权重系数发送至智能体模块以进行存储;
19、若否,对应初始化模型继续训练。
20、本方案中,所述若否,对应初始化模型继续训练的步骤,具体包括:
21、基于预设的每个时间步,智能体模块根据当前状态任意选择一个影响交易效率和效益的因素以及对应归一化参数值,并提取在对应归一化参数值下的经验;
22、将所述经验发送至预设经验回放缓冲区以进行存储;
23、提取经验回放缓冲区中任意一批经验样本以重复进行训练,保存每次训练过程中主网络的参数,直至训练结束。
24、本方案中,所述得到损失函数值的步骤,具体包括:
25、提取训练样本中影响交易效率和效益的归一化参数值以及在对应归一化参数值下的市场环境状态;
26、将训练样本中影响交易效率和效益的归一化参数值以及在对应归一化参数值下的市场环境状态分别发送至目标网络模块和主网络模块,得到目标q值和预测q值;
27、基于均方差损失函数,根据目标q值和预测q值,得到损失函数值。
28、本方案中,所述得到当前电力市场的交易决策的步骤,包括:
29、提取交易样本数据中影响交易效率和效益的因素,以及对应因素的归一化参数值;
30、将因素的归一化参数值乘以对应的参数权重系数,得到对应因素的状态值;
31、将所有因素的状态值进行累加,得到对应交易样本数据的状态值;
32、基于状态值落入的预设状态值区间,匹配对应的电力交易优化决策。
33、本专利技术第二方面提供了一种基于多目标参数权重的电力交易优化决策系统,包括存储器和处理器,所述存储器中存储有一种基于多目标参数权重的电力交易优化决策方法程序,所述一种基于多目标参数权重的电力交易优化决策方法程序被所述处理器执行时实现如下步骤:
34、获取电力市场的交易数据;
35、将电力市场的交易数据进行预处理,得到交易样本数据;
36、将交易样本数据发送至预设的电力市场环境模型,得到当前电力市场的交易决策。
37、本方案中,所述预设的电力市场环境模型的构建步骤,具体包括:
38、将预设的初始化模型划分为目标网络模块、主网络模块和智能体模块;
39、获取电力市场的历史交易数据;
40、将电力市场的历史交易数据进行预处理,得到训练样本;
41、将训练样本发送至目标网络模块和主网络模块,得到损失函数值;
42、若损失函数值小于等于预设第一阈值,则训练结束,并提取对应的参数权重系数;
43、将所述参数权重系数发送至智能体模块以进行存储。
44、本方案中,还包括:
45、若损失函数大于预设第一阈值,根据损失函数确定主网络参数的梯度,并基于梯度下降法更新主网络的参数,将主网络的参数设为θq,其公式为其中θ′q表示主网络的调整参数,k是学习率,表示损失函数l关于主网络参数的梯度;通过主网络的调整参数对主网络的参数进行替换。
46、本专利技术公开的一种基于多目标参数权重的电力交易优化决策方法及系统,通过强化学习相关算法,借助计算机强大算力,一边进行数据收集,一边进行最优策略输出,提供了一种电力交易多目标权重自动选择方法,避免人员干预,让策略制定更有信任度。
本文档来自技高网...【技术保护点】
1.一种基于多目标参数权重的电力交易优化决策方法,其特征在于,包括:
2.根据权利要求1所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述预设的电力市场环境模型的构建步骤,具体包括:
3.根据权利要求2所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,还包括:
4.根据权利要求2所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,还包括:
5.根据权利要求4所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述若否,对应初始化模型继续训练的步骤,具体包括:
6.根据权利要求2所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述得到损失函数值的步骤,具体包括:
7.根据权利要求1所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述得到当前电力市场的交易决策的步骤,包括:
8.一种基于多目标参数权重的电力交易优化决策系统,其特征在于,包括存储器和处理器,所述存储器中存储有一种基于多目标参数权重的电力交易优化决策方
9.根据权利要求8所述的一种基于多目标参数权重的电力交易优化决策系统,其特征在于,所述预设的电力市场环境模型的构建步骤,具体包括:
10.根据权利要求9所述的一种基于多目标参数权重的电力交易优化决策系统,其特征在于,还包括:
...【技术特征摘要】
1.一种基于多目标参数权重的电力交易优化决策方法,其特征在于,包括:
2.根据权利要求1所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述预设的电力市场环境模型的构建步骤,具体包括:
3.根据权利要求2所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,还包括:
4.根据权利要求2所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,还包括:
5.根据权利要求4所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述若否,对应初始化模型继续训练的步骤,具体包括:
6.根据权利要求2所述的一种基于多目标参数权重的电力交易优化决策方法,其特征在于,所述得...
【专利技术属性】
技术研发人员:付强,欧阳中桢,黄威,李腾飞,何楠,段楚豪,刘其臻,赵俊,粟海,贺常德,王喜,黄婷,陈琳,李锐,谭龙飞,魏萧煜,
申请(专利权)人:湖南星通电力信息通信有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。