The invention discloses a decentralized Q method for power system economic dispatch based on limit shift learning. The dispersion of Q method for power system economic dispatch limit based on transfer learning, the Q method of decentralized power system economic dispatch limit based on transfer learning, non convex economic dispatch problem can not only solve the water turbine valve point effect, and can calculate the decentralized optimization, adapt to the decentralized economic dispatch, and using the mechanism of limit transfer learning, to disperse the initial matrix Q method is modified, so that the convergence speed of the algorithm is greatly improved.
【技术实现步骤摘要】
一种基于极限迁移学习的电力系统经济调度分散Q方法
本专利技术涉及电力系统经济调度
,具体为一种基于极限迁移学习的电力系统经济调度分散Q方法。
技术介绍
现代社会中,节能减排越来越受到人们的重视,我国政府非常重视节能,供电企业也应当响应国家政策。而经济调度研究的是如何在额定负荷下达到机组发电功率最优组合,其最终目的就是研究如何减少系统发电成本。但电力系统传统的经济调度方式都是集中式的。集中式调度通常不灵活且收敛速度缓慢,它需要复杂的通信网络收集全局信息和一个强大的中央控制器来处理大量数据,无法满足区域隐私和独立控制的需求,且无法及时在间歇性和不确定性的可再生能源的剧烈变化中做出响应。在未来智能电网的快速发展下,集中式调度必定难以为继,分散式经济调度应运而生。但是优化算法方面,传统的人工智能算法,如GA算法、ABC算法、PSO算法都是集中式的,经典优化方法,如牛顿法、内点法等却无法解决含汽轮机的非凸函数的优化问题。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供了一种基于极限迁移学习的电力系统经济调度分散Q方法,解决了传统的人工智能算法,如GA算法、ABC算法、PSO算法都是集中式的,经典优化方法,如牛顿法、内点法等却无法解决含汽轮机的非凸函数的优化问题的问题。(二)技术方案为实现上述目的,本专利技术提供如下技术方案:一种基于极限迁移学习的电力系统经济调度分散Q方法,包括以下步骤:S1、由发电机的发电成本参数及约束条件确定经济调度模型,确立以最小化系统的发电成本作为适应度函数;S2、建立由调度中心做协调,各发电机独自做分散式计算的分散式 ...
【技术保护点】
一种基于极限迁移学习的电力系统经济调度分散Q方法,其特征在于:包括以下步骤:S1、由发电机的发电成本参数及约束条件确定经济调度模型,确立以最小化系统的发电成本作为适应度函数;S2、建立由调度中心做协调,各发电机独自做分散式计算的分散式经济调度框架,发电机的输出有功功率作为优化变量,将变量和变量变化动作均进行二进制编码,并把其储存在传统Q学习算法的Q矩阵中,并确定各变量产生种群的大小;S3、选取典型日的日负荷曲线作为准优化目标;各发电机分别利用种群进行寻优;计算每个个体的目标函数;计算分散Q方法的奖励函数;更新变量的Q矩阵;S4、各发电机分别给调度中心上传优化结果,调度中心评估此次优化结果的优劣,若优化结果比上一次差,则驳回此次结果,并保留上次优化策略;否则,完全采用此次优化策略;S5、判断是否达到最大迭代次数,若达到最大迭代次数,则结束计算并输出调度中心收集的优化策略结果和优化后各变量的Q矩阵;否则,返回利用种群进行寻优的步骤;S6、迭代结束后,对记录的准优化后的Q矩阵进行极限迁移学习,得到修正后的Q矩阵;S7、将修正Q矩阵作为新的优化初始矩阵,再次利用分散Q方法进行新目标的分散式经济 ...
【技术特征摘要】
1.一种基于极限迁移学习的电力系统经济调度分散Q方法,其特征在于:包括以下步骤:S1、由发电机的发电成本参数及约束条件确定经济调度模型,确立以最小化系统的发电成本作为适应度函数;S2、建立由调度中心做协调,各发电机独自做分散式计算的分散式经济调度框架,发电机的输出有功功率作为优化变量,将变量和变量变化动作均进行二进制编码,并把其储存在传统Q学习算法的Q矩阵中,并确定各变量产生种群的大小;S3、选取典型日的日负荷曲线作为准优化目标;各发电机分别利用种群进行寻优;计算每个个体的目标函数;计算分散Q方法的奖励函数;更新变量的Q矩阵;S4、各发电机分别给调度中心上传优化结果,调度中心评估此次优化结果的优劣,若优化结果比上一次差,则驳回此次结果,并保留上次优化策略;否则,完全采用此次优化策略;S5、判断是否达到最大迭代次数,若达到最大迭代次数,则结束计算并输出调度中心收集的优化策略结果和优化后各变量的Q矩阵;否则,返回利用种群进行寻优的步骤;S6、迭代结束后,对记录的准优化后的Q矩阵进行极限迁移学习,得...
【专利技术属性】
技术研发人员:郑宇,孟科,徐岩,邱靖,董朝阳,李正佳,
申请(专利权)人:南方电网科学研究院有限责任公司,苏州华天国科电力科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。