System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 海上高温余热有机朗肯循环发电系统优化控制方法及系统技术方案_技高网

海上高温余热有机朗肯循环发电系统优化控制方法及系统技术方案

技术编号:42793936 阅读:0 留言:0更新日期:2024-09-21 00:49
本发明专利技术涉及工业余热利用领域,公开了一种海上高温余热有机朗肯循环发电系统优化控制方法及系统,其采用深度神经网络作为强化学习的智能体,观察带导热油循环的满液式相变换热有机朗肯循环余热回收系统的核心状态;在保证系统安全的前提下获得最大积累输出功为目标,根据所观察到的状态输出相应最优的工质泵转速、冷却水泵转速、导热油泵转速以及导热油流量分流阀开度的控制信号;系统执行控制信号后智能体会获取以当前输出功大小评价的奖励函数,判断执行动作的好坏;智能体通过上述过程反复与系统交互训练,并不断向奖励大的方向收敛,最终会学习到一个保证安全性的优化控制策略。本发明专利技术能解决系统在大范围波动工况下的安全高效控制问题。

【技术实现步骤摘要】

本专利技术涉及一种工业余热利用领域,特别是关于一种海上高温余热有机朗肯循环发电系统优化控制方法及系统


技术介绍

1、主电站作为海上平台的主要能耗设备,可回收的余热资源非常可观。其能效提升不仅可以减少原油、天然气等能源的消耗,实现降本增效,同时可以减少二氧化碳的排放。有机朗肯循环因其热效率较高、工质适应性强、结构简单等优点被广泛应用。然而由于实际生产过程中主电站设备工况的不断变化,其烟气余热源也会随之变化,因此有机朗肯循环余热回收系统经常处在波动的运行工况中,为保证余热回收系统的安全和高效运行,系统控制至关重要。

2、但是由于工况瞬态变化时余热回收系统处在非稳态再加之系统的强非线性,使系统的在线优化控制变的非常困难。此外,还要兼顾系统的安全性问题,又给系统控制带来了挑战。由于高温烟气可能会使有机工质分解,因此常带有导热油循环。另一方面为了避免波动的工况条件下两相的流体进入透平膨胀机和泵,采用满液式换热器可以有效避免此问题。


技术实现思路

1、针对上述问题,本专利技术的目的是提供一种海上高温余热有机朗肯循环发电系统优化控制方法及系统,其针对带导热油循环的满液式相变换热有机朗肯循环余热回收系统,采用drl智能优化算法解决系统在大范围波动工况下的安全高效控制问题。

2、为实现上述目的,本专利技术采取以下技术方案:一种海上高温余热有机朗肯循环发电系统优化控制方法,其包括:采用深度神经网络作为强化学习的智能体,观察带导热油循环的满液式相变换热有机朗肯循环余热回收系统的核心状态;在保证系统安全的前提下以获得最大积累输出功为目标,根据所观察到的状态输出相应最优的工质泵转速、冷却水泵转速、导热油泵转速以及导热油流量分流阀开度的控制信号;系统执行控制信号后智能体会即时获取以当前输出功大小评价的奖励函数,以判断执行动作的好坏;智能体通过上述过程反复与系统交互训练,并不断向奖励大的方向收敛,最终会学习到一个保证安全性的优化控制策略。

3、进一步,智能体的控制对象为带导热油循环的满液式相变换热有机朗肯循环余热回收系统;控制对象是drl智能体在训练时的环境。

4、进一步,建立drl的学习环境,包括:

5、采用系统的动态仿真模型作为drl智能体学习环境,待智能体用模型学习到初步的优化控制策略后,再利用真实的系统作为训练环境对控制策略微调修正。

6、进一步,观察到的状态是能够唯一表示系统当前状态的一组观察变量;

7、观察量包括热源的温度和流量,导热油在烟气-导热油换热器的进出口温度和流量、有机工质的最高温度和压力、最低温度和压力以及工质流量。

8、进一步,奖励函数的设置,包括:

9、第一部分,奖励函数与当前输出功的大小成正相关,输出功越大奖励值越大;

10、第二部分,如果该动作使蒸发器或冷凝器内的液位状态超过安全限值,以及使系统的最高温度或压力超过限值,则获得一个负的奖励值;

11、奖励函数由上述两部分奖励和惩罚构成,由奖励函数计算奖励。

12、进一步,智能体的输出动作包括工质泵转速、冷却水泵转速、导热油泵转速以及导热油流量分流阀开度,这些动作信号直接给到相应的执行器,以快速执行目标动作。

13、进一步,智能体通过上述过程反复与系统交互训练,并不断向奖励大的方向收敛,最终会学习到一个保证安全性的优化控制策略,包括:

14、设置基于逻辑的以pid为控制器的安全控制策略:当drl策略可能出现危险动作时,及时切换到安全控制策略以保护系统样机;

15、在此安全机制下,进一步利用真实系统作为学习环境,对控制动作赋予较小的探索空间,以此校正drl智能体所学到的策略;

16、其中,较小的探索空间为当前所学动作值的±10%内。

17、一种海上高温余热有机朗肯循环发电系统优化控制系统,其包括:第一处理模块,采用深度神经网络作为强化学习的智能体,观察带导热油循环的满液式相变换热有机朗肯循环余热回收系统的核心状态;第二处理模块,在保证系统安全的前提下以获得最大积累输出功为目标,根据所观察到的状态输出相应最优的工质泵转速、冷却水泵转速、导热油泵转速以及导热油流量分流阀开度的控制信号;第三处理模块,系统执行控制信号后智能体会即时获取以当前输出功大小评价的奖励函数,以判断执行动作的好坏;优化控制策略获取模块,智能体通过上述过程反复与系统交互训练,并不断向奖励大的方向收敛,最终会学习到一个保证安全性的优化控制策略。

18、一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行上述方法中的任一方法。

19、一种计算设备,其包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行上述方法中的任一方法的指令。

20、本专利技术由于采取以上技术方案,其具有以下优点:

21、本专利技术与现有一般的带导热油循环的满液式相变换热有机朗肯循环余热回收系统优化控制方法相比,本专利技术在实际使用时计算任务很小,不需要对未来干扰进行预测,也不需要大量的在线优化计算,因此可有效保证控制的实时性;而且本专利技术不但可以使系统获得更多的回收功,同时也能保证系统的安全性。

本文档来自技高网...

【技术保护点】

1.一种海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,包括:

2.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,智能体的控制对象为带导热油循环的满液式相变换热有机朗肯循环余热回收系统;控制对象是DRL智能体在训练时的环境。

3.如权利要求2所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,建立DRL的学习环境,包括:

4.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,观察到的状态是能够唯一表示系统当前状态的一组观察变量;

5.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,奖励函数的设置,包括:

6.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,智能体的输出动作包括工质泵转速、冷却水泵转速、导热油泵转速以及导热油流量分流阀开度,这些动作信号直接给到相应的执行器,以快速执行目标动作。

7.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,智能体通过上述过程反复与系统交互训练,并不断向奖励大的方向收敛,最终会学习到一个保证安全性的优化控制策略,包括:

8.一种海上高温余热有机朗肯循环发电系统优化控制系统,其特征在于,包括:

9.一种存储一个或多个程序的计算机可读存储介质,其特征在于,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如权利要求1至7所述方法中的任一方法。

10.一种计算设备,其特征在于,包括:一个或多个处理器、存储器及一个或多个程序,其中一个或多个程序存储在所述存储器中并被配置为所述一个或多个处理器执行,所述一个或多个程序包括用于执行如权利要求1至7所述方法中的任一方法的指令。

...

【技术特征摘要】

1.一种海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,包括:

2.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,智能体的控制对象为带导热油循环的满液式相变换热有机朗肯循环余热回收系统;控制对象是drl智能体在训练时的环境。

3.如权利要求2所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,建立drl的学习环境,包括:

4.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,观察到的状态是能够唯一表示系统当前状态的一组观察变量;

5.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,奖励函数的设置,包括:

6.如权利要求1所述海上高温余热有机朗肯循环发电系统优化控制方法,其特征在于,智能体的输出动作包括工质泵转速、冷却水泵转速、导热油泵转...

【专利技术属性】
技术研发人员:尹汉军徐海波秦小刚张明安维峥张祖妍刘向东燕夏婧马晨波马英怡窦天棋
申请(专利权)人:中海石油中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1