本发明专利技术涉及用于计算机辅助地控制和/或调节技术系统、尤其能量产生装置的方法。在调节或者控制的范围中要实施的行动(a)利用数字优化方法和尤其借助于粒子群优化(PSO)确定。所述数字优化方法在此使用事先确定的模拟模型(RNN),利用所述模拟模型(RNN)预测技术系统的状态,并且基于此确定质量标准,所述质量标准反映技术系统的运行的优化准则。
【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及用于计算机辅助地控制和/或调节技术系统、尤其能量产生装置的方 法。
技术介绍
在控制或调节技术系统时,经常值得期望的是,通过执行相应的行动这样地影响 技术系统的运行,使得技术系统的行为关于特定的准则被优化。例如在运行燃气轮机时有 意义的是,减少通过涡轮机产生的废气排放或者保持燃气轮机的燃烧室的燃烧动力学(也 称作燃烧室蜂鸣声(Brennkammerbrummen))尽可能小。在此例如可能影响关于将气体和空 气输送到燃气轮机的燃烧室的参数。 由现有技术已知计算机辅助的方法,利用所述方法确定行动选择规则,据此对于 技术系统的相应的相继状态确定行动,其中所述状态通过系统的适当的状态变量来表征, 所述行动鉴于优化准则、诸如上面提及的低有害物质排放或者低燃烧室蜂鸣声是最优的。 在文献和中描述基于利用由已知状态和行动组成的训练数据学习递归神经网络来 确定行动选择规则。按照行动选择规则,对于技术系统的当前的状态在考虑以前的状态的 情况下根据优化准则输出行动序列。 用于借助于递归神经网络确定行动选择规则的已知的方法具有以下缺点:在学习 递归神经网络时,质量标准形式的优化准则一起注入(e i nf 1 i efien )。因此在技术系统的实 际运行中不能容易地对变化的优化准则作出反应,因为为此所述神经网络必须完全重新被 学习。
技术实现思路
因此本专利技术的任务是,实现,所 述方法以简单的方式确定按照优化准则在技术系统处要执行的行动。 所述任务通过独立专利权利要求解决。本专利技术的改进方案在从属专利权利要求中 定义。 按照本专利技术的方法用于计算机辅助地控制和/或调节技术系统。所述技术系统尤 其是能量产生装置并且在一种特别优选的实施方式中是燃气涡轮,如此外在下面进一步描 述的。然而必要时,所述技术系统也可以是再生能量产生装置形式、诸如风力涡轮机的能量 产生装置。技术系统的动态行为在按照本专利技术的方法中对于多个时间点分别地通过技术系 统的状态和在该状态下在技术系统处执行的行动来表征,其中在各自时间点的各自行动通 向在下一时间点技术系统的新的状态。行动序列在此表示一个或多个相继地按时间顺序在 技术系统处要执行的行动。技术系统的状态包括一个和优选多个状态变量,所述状态变量 是技术系统的运行状态或者影响技术系统的运行的参量。与此相对地,行动是一个或多个 行动变量的变化,其中所述行动变量必要时也可以是状态变量,所述状态变量可以在调节 或者控制技术系统的范围中被改变。 在按照本专利技术的方法中,可以为每个行动序列基于技术系统的、由执行行动序列 的行动得出的状态计算关于用于运行技术系统的优化准则的质量标准,其中所述质量标准 越高,优化准则越好地被满足。优化准则的概念在此可以被广泛地理解,并且所述准则必要 时可以包括多个子准则或者分准则。 按照本专利技术方法的步骤或者特征a),提供技术系统的模拟模型,利用所述模拟模 型可以为各自的行动序列预测技术系统的由此得出的状态。这样的模拟模型自身由现有技 术是已知的。所述模拟模型可以例如是数据驱动式模型,所述模型基于技术系统运行的事 先确定的数据,或者利用所述数据学习。同样地,所述模拟模型可以是技术系统的分析模型 和/或物理模型。 在一种特别优选的实施方式中,神经网络、尤其递归神经网络形式的数据驱动式 模型被用作模拟模型。所述神经网络在此基于已知的行动序列的训练数据利用技术系统的 已知的由此得出的状态学习。在一种特殊实施方式中,在出版物中描述的神经网络被使 用用于在按照本专利技术的方法的范围中对技术系统的动态的行为进行建模。代替神经网络, 所述数据驱动式模型必要时也可以基于高斯过程和/或基于回归树和/或基于支持向量回 归(Support Vector Regression)。 在按照本专利技术的方法的步骤b)中,在来自相继的预先给定的时间点序列的各自的 预先给定的时间点,借助于数字优化方法确定具有尽可能高的质量标准的行动序列,其中 所述优化方法使用提供的模拟模型,以便为在数字优化方法的范围中产生的行动序列预测 技术系统的由此得出的状态,并且接着利用所述预测的状态确定所产生的行动序列的质量 标准。所有在数字优化方法范围中处理的或者生成的行动序列并且不仅仅由数字优化方法 确定的和最终输出的行动序列属于产生的行动序列概念。不同于其它方法,数字优化方法 不需要事先执行的学习步骤。 在一种特别优选的实施方式中,将非凸启发式优化方法和/或无梯度随机搜索方 法用作数字优化方法。特别优选地,所述数字优化方法是粒子群优化(英语 :PartiCle Swarm Optimization(粒子群优化))和/或进化算法和/或遗传算法和/或模拟退火 (Simulated Annealing)。所有这些方法自身由现有技术已知,并且因此不更详细地予以描 述。 在按照本专利技术的方法的步骤c)中,在步骤b)中确定的行动序列的行动的至少一部 分在技术系统处被执行。换句话说,所确定的行动序列的第一行动和必要时还有其它之后 的行动被执行。特别地,可以在步骤c)中仅执行第一行动,其中直接紧接着步骤b)被重复用 于确定新的要执行的行动。由此实现,所述行动非常好地满足所使用的优化准则。 按照本专利技术的方法的特点在于,所使用的模拟模型以及数字优化方法事先在学习 过程的范围中均不需要所述质量标准,如这例如在借助于神经网络学习行动选择规则时是 这种情况。因此所述方法可以快速地适配在运行技术系统期间的变化的条件,其方式是:所 述质量标准或者其计算适当地被改变。优选地在此在调节和/或控制技术系统时,设置用户 接口,通过所述用户接口用户可以改变质量标准。用户可以因此在线地在运行技术系统期 间改变质量标准。技术系统的运行为此不必被中断。用户可以通过用户接口通过改变质量 标准鉴于运行技术系统的最佳性而调整由其期望的重心。在燃气涡轮形式的技术系统的情 况下,所述用户可以例如在涡轮机的寿命消耗和效率之间进行权衡。在紧急情形下,可能有 意义的是,运行具有提高的寿命消耗的涡轮机,因为电流可以显著更贵地被出售,并且补偿 提尚的耗损。 在另一特别优选的实施方式中,所述数字优化方法是粒子群优化,其粒子分配给 各自的行动序列,所述行动序列在初始化粒子群优化时随机地被确定,并且在粒子群算法 优化的范围中迭代地借助于各自的速度向量被改变,其中各自的速度向量借助于适应度函 数被确定,所述适应度函数对应于所述质量标准。所述粒子群优化可以因此在按照本专利技术 的方法中以简单的方式通过以下方式被实现:即在此所使用的适应度函数与质量标准被看 成一样的。 在另一变型方案中,在粒子群优化的范围中在为各自的粒子计算速度向量时,按 照预先给定的拓扑结构考虑多个相邻粒子。所述拓扑结构指定在粒子之间的边,所述粒子 在该意义下对应于节点。在此通过边与各自的粒子(直接地)连接的所有粒子是各自粒子的 相邻粒子。通过基于预先给定的拓扑结构考虑相邻粒子,借助于粒子群优化通常找到更好 的解。 在特殊的变型方案中,环形拓扑结构被用作预先给定的拓扑结构,其中所述粒子 通过边这样连接,使得粒子与边构成环。因此每个粒子在环上具有至少两个相邻粒子。可选 地,对于各自的粒子可以设置一个或多个其它的边,所述边将各自的粒子本文档来自技高网...
【技术保护点】
用于计算机辅助地控制和/或调节技术系统、尤其能量产生装置的方法,其中技术系统的动态行为对于多个时间点分别通过技术系统的状态(s)和在该状态下在技术系统处执行的行动(a)表征,其中在各自的时间点的各自的行动(a)导致技术系统在下一时间点的新的状态(s),并且行动序列(A)表示一个或多个相继地按时间顺序在技术系统处要执行的行动(a),其中对于每个行动序列(A)基于技术系统的由执行行动序列(A)的行动(a)得出的状态(s1、s2、…、sT)可以计算关于技术系统运行的优化准则的质量标准(RE),其中所述质量标准(RE)越高,优化准则越好地被满足,其中:a)提供技术系统的模拟模型(RNN),利用所述模拟模型对于各自的行动序列(A)可以预测技术系统的由此得出的状态(s1、s2、…sT);b)在来自相继的预先给定的时间点的序列的各自的预先给定的时间点(t),借助于数字优化方法(PSO)确定具有尽可能高的质量标准的行动序列(A),其中所述数字优化方法使用所述模拟模型(RNN),以便为在所述数字优化方法(PSO)的范围内中产生的行动序列(Ai)预测由此得出的状态(s1、s2、…、sT),并且接着利用所述预测的状态(s1、s2、…、sT)确定所产生的行动序列(Ai)的质量标准;c)在技术系统处执行在步骤b)中确定的行动序列(A)的行动(a)的至少一部分。...
【技术特征摘要】
【国外来华专利技术】...
【专利技术属性】
技术研发人员:D海因,A亨切尔,S迪尔,T伦克勒,S尤德卢夫特,
申请(专利权)人:西门子公司,
类型:发明
国别省市:德国;DE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。