工厂的控制装置及工厂的控制方法制造方法及图纸

技术编号：4266433 阅读：208 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供即使在学习初始阶段也能够学习可安全地运行控制对象的操作信号的生成方法的控制技术。本发明专利技术提供的工厂的控制装置以及工厂的控制方法具备以下的功能：即使在工厂的控制中使用的多个操作端的动作速度中存在差异或者操作端随时间流逝劣化动作速度劣化的情况下，也为能够良好地控制工厂来适当地决定学习的约束条件。将第二评价值信号相加到第一评价值信号，所以，在控制对象和模型的特性不同的区域不生成操作信号，而只能在特性相近的区域学习操作信号的生成方法。因此，可提高运行刚刚开始后的控制对象的安全性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及火力发电厂等的控制装置及控制方法。
技术介绍
近年来，在无教师学习的领域中，正在广泛深入研究称为强化学习的方法。所谓强化学习，众所周知，是通过和控制对象等的环境的凑试的相互作用，使从环境得到的测量信号成为希望值那样，来做成学习对于环境的操作信号的生成方法的学习控制的框架。在强化学习中，把根据从环境得到的测量信号计算的标量的评价值(在强化学习中称为报酬)作为线索，学习从现在状态到将来得到的评价值的期望值成为最大或者最小那样的对于环境的操作信号。作为安装这样的学习功能的方法，已知的有例如在非专利文献1中叙述的Actor-Critic、 Q学习、实时Dynamic Programming等的算法。另外，作为发展上述方法的强化学习的框架，在上述文献中介绍了称为 Dyna结构的框架。这是把模拟控制对象的模型作为对象预先学习生成什么样的操作信号好、并使用该学习结果决定在控制对象上施加的操作信号的方法。另外，为了使控制对象和模型的误差成为最小，具有使用对于控制对象的操作信号和测量信号调整模型的功能。另外，作为使用强化学习的技术，可以举出在专利文献1中叙述的技术。它是这样的技术准备好多个具有模型和学习功能的作为系统的组的强化学习模块、求在各强化学习模块中模型和控制对象的预测误差越小取值越大的责任信号、与该责任信号成比例给对于从各强化学习模块生成的控制对象的操作信号加权、决定在控制对象上施加的操作信号。在工厂的控制装置中，处理从作为控制对象的工厂得到的测量信号，计算给予控制对象的操作信号。在控制装置中安装计算操作信号的算法，使...

【技术保护点】
一种工厂的控制装置，具有使用作为工厂的运行状态量的测量信号计算给予工厂的成为控制指令的操作信号的操作信号生成部，其特征在于，　在控制装置中，使其分别具有：模拟成为控制对象的工厂的控制特性的模型；保存有包含在用操作信号生成部计算操作信号中使用的控制参数的控制逻辑数据的控制逻辑数据库；保存有控制工厂的状态量的操作端的操作端规格数据的操作端规格数据库；保存有过去的操作信号的操作信号数据库；保存有过去的测量信号的测量信号数据库；具有使用在控制逻辑数据库和操作端规格数据库中保存的数据，决定学习参数的初始值的功能和使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的数据，更新所述学习参数的功能的学习条件决定部；把在学习参数中包含的每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、使用所述模型学习工厂的操作方法的学习部；保存用学习部学习的学习信息数据的学习信息数据库；在操作信号生成部中，使其具有使用作为工厂的运行状态量的测量信号和在学习信息数据库中保存的学习信息数据、计算对于工厂的操作信号的学习信号生成部。

【技术特征摘要】
JP 2006-2-28 2006-053671;JP 2006-3-29 2006-0916721. 一种工厂的控制装置，具有使用作为工厂的运行状态量的测量信号计算给予工厂的成为控制指令的操作信号的操作信号生成部，其特征在于，在控制装置中，使其分别具有模拟成为控制对象的工厂的控制特性的模型；保存有包含在用操作信号生成部计算操作信号中使用的控制参数的控制逻辑数据的控制逻辑数据库；保存有控制工厂的状态量的操作端的操作端规格数据的操作端规格数据库；保存有过去的操作信号的操作信号数据库；保存有过去的测量信号的测量信号数据库；具有使用在控制逻辑数据库和操作端规格数据库中保存的数据，决定学习参数的初始值的功能和使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的数据，更新所述学习参数的功能的学习条件决定部；把在学习参数中包含的每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、使用所述模型学习工厂的操作方法的学习部；保存用学习部学习的学习信息数据的学习信息数据库；在操作信号生成部中，使其具有使用作为工厂的运行状态量的测量信号和在学习信息数据库中保存的学习信息数据、计算对于工厂的操作信号的学习信号生成部。2. 根据权利要求1所述的工厂的控制装置，其特征在于，具有学习信息追加部，其具有这样的功能即使用在学习信息数据库中保存的学习信息数据，把在学习参数中包含的每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、来推定在学习部中实施了学习时的学习信息数据，向学习信息数据库发送作为该推定结果的追加学习信息数据的功能。3. 根据权利要求1所述的工厂的控制装置，其特征在于，构成为使控制装置学习条件决定部具有下述功能即对在控制逻辑数据库中保存的控制参数中、为限制每单位时间的信号的变化幅度而设定的参数和在操作端规格数据库中保存的操作端的动作速度的值进行比较，把绝对值小的值作为学习参数的初始值的功能。4. 一种工厂的控制装置，其使用作为火力发电厂的运行状态量的测量信号，计算给予火力发电厂的成为控制指令的操作信号来控制火力发电厂，其特征在于，在控制装置中，使其分别具有模拟成为控制对象的火力发电厂的控制特性的模型；保存有包含在用操作信号生成部操作信号的计算中使用的控制参数的控制逻辑数据的控制逻辑数据库；保存有控制火力发电厂的状态量的操作端的操作端规格数据的操作端规格数据库；保存有过去的操作信号的操作信号数据库；保存有过去的测量信号的测量信号数据库；具有使用在控制逻辑数据库和操作端规格数据库中保存的数据，决定学习参数的初始值的功能，和使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的数据，更新所述学习参数的功能的学习条件决定部；把在学习参数中包含的每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、使用所述模型学习火力发电厂的操作方法的学习部；保存有用学习部学习的学习信息数据的学习信息数据库；在操作信号生成部中，使其具有使用作为工厂的运行状态量的测量信号和在学习信息数据库中保存的学习信息数据、计算对于火力发电厂的操作信号的学习信号生成部。5. 根据权利要求4所述的工厂的控制装置，其特征在于，在测量信号中，包含氮氧化物浓度、一氧化碳浓度、二氧化碳浓度、硫化氧化物、以及水银的至少一种，在操作信号中包含决定空气调节阀的开度、空气流量、燃料流量的至少一种的信号，在控制装置中已装备的学习条件决定部中，使之具有以下功能即使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的数据，推定火力发电厂是否正在实施包含燃烧器切换运行、煤种类切换运行、以及负荷变化运行的至少一种的运行，并根据该推定结果更新学习参数的功能；和使用在操作信号数据库和测量信号数据库中保存的数据推定操作端的动作速度，并根据该推定结果更新学习参数的功能。6. 根据权利要求5所述的工厂的控制装置，其特征在于，构成为在控制装置中，使之配备有具有使用在学习信息数据库中保存的学习信息，把在学习参数中包含的每单位时间的操作信号变化幅度的限制值作为学习的约束条件来推定在学习部中实施了学习时的学习信息数据，将作为该推定结果的追加学习信息数据发送给学习信息数据库的功能的学习信息追加部，在所述操作信号生成部的学习信号生成部中，使用在学习信息数据库中保存的追加学习信息数据来计算操作信号。7. 根据权利要求6所述的工厂的控制装置，其特征在于，构成为在控制装置的学习部中，具有下述功能即把操作端的动作区域分割为预先设定的区域、把从分割后的各区域仅能对邻接的区域进行操作设定为学习的约束条件的功能；和计算作为基于模型的模拟的预测结果的模型输出为到达实现其目标值的区域所需要的操作次数的功能；构成为在控制装置的学习信息追加部中，具有下述功能即分割为预先设定的区域的操作端的动作区域中的某区域的操作方法，作为在单位时间后能够到达的区域中、向操作次数的值成为最小的区域移动的操作方法的功能。8. 根据...

【专利技术属性】
技术研发人员：关合孝朗，清水悟，神永荣一，山田昭彦，林喜治，楠见尚弘，深井雅之，
申请(专利权)人：株式会社日立制作所，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人