【技术实现步骤摘要】
本专利技术涉及火力发电厂等的控制装置及控制方法。
技术介绍
近年来,在无教师学习的领域中,正在广泛深入研究称为强化学习的方 法。所谓强化学习,众所周知,是通过和控制对象等的环境的凑试的相互作 用,使从环境得到的测量信号成为希望值那样,来做成学习对于环境的操作 信号的生成方法的学习控制的框架。在强化学习中,把根据从环境得到的测量信号计算的标量的评价值(在 强化学习中称为报酬)作为线索,学习从现在状态到将来得到的评价值的期 望值成为最大或者最小那样的对于环境的操作信号。作为安装这样的学习功 能的方法,已知的有例如在非专利文献1中叙述的Actor-Critic、 Q学习、实 时Dynamic Programming等的算法。另外,作为发展上述方法的强化学习的框架,在上述文献中介绍了称为 Dyna结构的框架。这是把模拟控制对象的模型作为对象预先学习生成什么样 的操作信号好、并使用该学习结果决定在控制对象上施加的操作信号的方法。 另外,为了使控制对象和模型的误差成为最小,具有使用对于控制对象的操 作信号和测量信号调整模型的功能。另外,作为使用强化学习的技术,可以举出在专利文献1中叙述的技术。 它是这样的技术准备好多个具有模型和学习功能的作为系统的组的强化学 习模块、求在各强化学习模块中模型和控制对象的预测误差越小取值越大的 责任信号、与该责任信号成比例给对于从各强化学习模块生成的控制对象的 操作信号加权、决定在控制对象上施加的操作信号。在工厂的控制装置中,处理从作为控制对象的工厂得到的测量信号,计 算给予控制对象的操作信号。在控制装置中安装计算操作信号的算法,使 ...
【技术保护点】
一种工厂的控制装置,具有使用作为工厂的运行状态量的测量信号计算给予工厂的成为控制指令的操作信号的操作信号生成部,其特征在于, 在控制装置中,使其分别具有:模拟成为控制对象的工厂的控制特性的模型;保存有包含在用操作信号生成部计算操作信号中使用的控制参数的控制逻辑数据的控制逻辑数据库;保存有控制工厂的状态量的操作端的操作端规格数据的操作端规格数据库;保存有过去的操作信号的操作信号数据库;保存有过去的测量信号的测量信号数据库;具有使用在控制逻辑数据库和操作端规格数据库中保存的数据,决定学习参数的初始值的功能和使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的数据,更新所述学习参数的功能的学习条件决定部;把在学习参数中包含的每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、使用所述模型学习工厂的操作方法的学习部;保存用学习部学习的学习信息数据的学习信息数据库;在操作信号生成部中,使其具有使用作为工厂的运行状态量的测量信号和在学习信息数据库中保存的学习信息数据、计算对于工厂的操作信号的学习信号生成部。
【技术特征摘要】
JP 2006-2-28 2006-053671;JP 2006-3-29 2006-0916721. 一种工厂的控制装置,具有使用作为工厂的运行状态量的测量信号计算给予工厂的成为控制指令的操作信号的操作信号生成部,其特征在于,在控制装置中,使其分别具有模拟成为控制对象的工厂的控制特性的模型;保存有包含在用操作信号生成部计算操作信号中使用的控制参数的控制逻辑数据的控制逻辑数据库;保存有控制工厂的状态量的操作端的操作端规格数据的操作端规格数据库;保存有过去的操作信号的操作信号数据库;保存有过去的测量信号的测量信号数据库;具有使用在控制逻辑数据库和操作端规格数据库中保存的数据,决定学习参数的初始值的功能和使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的数据,更新所述学习参数的功能的学习条件决定部;把在学习参数中包含的每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、使用所述模型学习工厂的操作方法的学习部;保存用学习部学习的学习信息数据的学习信息数据库;在操作信号生成部中,使其具有使用作为工厂的运行状态量的测量信号和在学习信息数据库中保存的学习信息数据、计算对于工厂的操作信号的学习信号生成部。2. 根据权利要求1所述的工厂的控制装置,其特征在于, 具有学习信息追加部,其具有这样的功能即使用在学习信息数据库中保存的学习信息数据,把在学习参数中包含的每单位时间的操作信号变化幅 度的限制值设定为学习的约束条件、来推定在学习部中实施了学习时的学习 信息数据,向学习信息数据库发送作为该推定结果的追加学习信息数据的功 能。3. 根据权利要求1所述的工厂的控制装置,其特征在于,构成为使控制装置学习条件决定部具有下述功能即对在控制逻辑数 据库中保存的控制参数中、为限制每单位时间的信号的变化幅度而设定的参 数和在操作端规格数据库中保存的操作端的动作速度的值进行比较,把绝对 值小的值作为学习参数的初始值的功能。4. 一种工厂的控制装置,其使用作为火力发电厂的运行状态量的测量信号,计算给予火力发电厂的成为控制指令的操作信号来控制火力发电厂,其 特征在于,在控制装置中,使其分别具有模拟成为控制对象的火力发电厂的控制 特性的模型;保存有包含在用操作信号生成部操作信号的计算中使用的控制 参数的控制逻辑数据的控制逻辑数据库;保存有控制火力发电厂的状态量的 操作端的操作端规格数据的操作端规格数据库;保存有过去的操作信号的操 作信号数据库;保存有过去的测量信号的测量信号数据库;具有使用在控制 逻辑数据库和操作端规格数据库中保存的数据,决定学习参数的初始值的功 能,和使用在控制逻辑数据库和操作信号数据库和测量信号数据库中保存的 数据,更新所述学习参数的功能的学习条件决定部;把在学习参数中包含的 每单位时间的操作信号变化幅度的限制值设定为学习的约束条件、使用所述 模型学习火力发电厂的操作方法的学习部;保存有用学习部学习的学习信息 数据的学习信息数据库;在操作信号生成部中,使其具有使用作为工厂的运 行状态量的测量信号和在学习信息数据库中保存的学习信息数据、计算对于 火力发电厂的操作信号的学习信号生成部。5. 根据权利要求4所述的工厂的控制装置,其特征在于, 在测量信号中,包含氮氧化物浓度、 一氧化碳浓度、二氧化碳浓度、硫化氧化物、以及水银的至少一种,在操作信号中包含决定空气调节阀的开度、 空气流量、燃料流量的至少一种的信号,在控制装置中已装备的学习条件决 定部中,使之具有以下功能即使用在控制逻辑数据库和操作信号数据库和 测量信号数据库中保存的数据,推定火力发电厂是否正在实施包含燃烧器切 换运行、煤种类切换运行、以及负荷变化运行的至少一种的运行,并根据该 推定结果更新学习参数的功能;和使用在操作信号数据库和测量信号数据库 中保存的数据推定操作端的动作速度,并根据该推定结果更新学习参数的功 能。6. 根据权利要求5所述的工厂的控制装置,其特征在于,构成为在控制装置中,使之配备有具有使用在学习信息数据库中保存 的学习信息,把在学习参数中包含的每单位时间的操作信号变化幅度的限制 值作为学习的约束条件来推定在学习部中实施了学习时的学习信息数据,将作为该推定结果的追加学习信息数据发送给学习信息数据库的功能的学习信 息追加部,在所述操作信号生成部的学习信号生成部中,使用在学习信息数 据库中保存的追加学习信息数据来计算操作信号。7. 根据权利要求6所述的工厂的控制装置,其特征在于,构成为在控制装置的学习部中,具有下述功能即把操作端的动作区 域分割为预先设定的区域、把从分割后的各区域仅能对邻接的区域进行操作 设定为学习的约束条件的功能;和计算作为基于模型的模拟的预测结果的模 型输出为到达实现其目标值的区域所需要的操作次数的功能;构成为在控 制装置的学习信息追加部中,具有下述功能即分割为预先设定的区域的操 作端的动作区域中的某区域的操作方法,作为在单位时间后能够到达的区域 中、向操作次数的值成为最小的区域移动的操作方法的功能。8. 根据...
【专利技术属性】
技术研发人员:关合孝朗,清水悟,神永荣一,山田昭彦,林喜治,楠见尚弘,深井雅之,
申请(专利权)人:株式会社日立制作所,
类型:发明
国别省市:JP[日本]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。