一种基于集成学习的带钢热轧过程故障分类方法及装置制造方法及图纸

技术编号:33429984 阅读:14 留言:0更新日期:2022-05-19 00:20
本发明专利技术公开了一种基于集成学习的带钢热轧过程故障分类方法及装置,该方法包括:获取带钢热轧过程中产生的历史样本数据,建立历史样本数据库;对历史样本数据库中不同数据集中的数据分别进行数据预处理;训练深度置信网络,对预处理后的历史样本数据进行特征提取并进行类型标注,以构建新的样本数据集;利用新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对带钢热轧过程数据进行故障分类,并结合历史故障维修信息定位故障变量。本发明专利技术的技术方案可以准确识别故障类型,充分利用已有历史故障维修信息进行故障定位,为带钢热轧过程故障诊断和运行维护提供有效的辅助决策信息。决策信息。决策信息。

【技术实现步骤摘要】
一种基于集成学习的带钢热轧过程故障分类方法及装置


[0001]本专利技术涉及工业过程故障诊断
,特别涉及一种基于集成学习的带钢热轧过程故障分类方法及装置。

技术介绍

[0002]带钢热轧过程由众多生产环节构成且相互耦合关联,具有机理复杂、流程长、工序内多变量耦合、工序间质量遗传、工况复杂多变、控制系统层级与质量相关指标多等特点,其制造过程在很大程度上决定了成品钢材质量。面向带钢热轧过程的故障分类技术将为系统准确识别故障类型、定位故障根源,并快速做出调控措施提供参考信息,具有重要的理论和工程意义。
[0003]现有的研究中,基于解析模型的诊断方法要求建立精确的过程机理模型,在实际工业应用过程中具有一定的局限性;基于知识的故障诊断方法对先验专家认识的依赖性非常强,难以在现代复杂流程工业中取得理想的监测效果;基于多元统计的诊断方法对过程的假定条件较多,故障诊断的结果高度依赖于过程数据的数量和质量。同时,现有方法更关注模型的建立和监测过程,对带钢热轧过程历史维修数据,即已知的故障类型及其产生原因信息利用不足,导致故障诊断准确率和效率不够高。
[0004]综上,现有技术存在处理带钢热轧过程大样本高维度非线性数据时效率较低、带钢热轧过程数据类别不平衡影响最终分类效果、特征提取质量不高、历史故障维修信息未能得到有效利用,导致最终故障诊断精度不够高等问题。

技术实现思路

[0005]本专利技术提供了一种基于集成学习的带钢热轧过程故障分类方法及装置,以解决现有技术处理带钢热轧过程大样本高维度非线性数据时效率较低、带钢热轧过程数据类别不平衡影响模型分类效果、传统模型的特征提取质量不高、历史故障维修信息未能得到有效利用,导致最终故障诊断精度不够高的技术问题。
[0006]为解决上述技术问题,本专利技术提供了如下技术方案:
[0007]一方面,本专利技术提供了一种基于集成学习的带钢热轧过程故障分类方法,所述基于集成学习的带钢热轧过程故障分类方法包括:
[0008]获取带钢热轧过程中产生的历史样本数据,建立历史样本数据库;其中,所述历史样本数据包括正常运行时的带钢热轧过程特征变量组成的正常数据集和出故障时的带钢热轧过程特征变量及历史故障维修信息组成的故障数据集;对所述历史样本数据库中不同数据集中的数据分别进行数据预处理;
[0009]训练深度置信网络,对预处理后的正常数据集和故障数据集中的带钢热轧过程特征变量分别进行特征提取,并进行类型标注,以构建新的样本数据集;
[0010]利用所述新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对待分类带钢热轧过程数据进行故障分类,并结合历史故障维修信息定位故障变量。
[0011]进一步地,在利用所述新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对待分类带钢热轧过程数据进行故障分类之后,所述方法还包括:
[0012]采用预设的评估方式对训练后的分类模型进行评估。
[0013]进一步地,所述历史样本数据库中包括正常运行时的带钢热轧过程正常数据集和多种不同类型的故障所对应的故障数据集;历史样本数据库中每一数据集均包括相同的带钢热轧过程特征变量。
[0014]进一步地,对历史样本数据库中不同数据集中的数据分别进行数据预处理,包括:
[0015]采用滑动窗口算法对带钢热轧过程特征变量平滑化;
[0016]采用Z

score算法对平滑后的带钢热轧过程特征变量进行归一化;其中,归一化后每个带钢热轧过程特征变量列对应的均值为0,方差为1;
[0017]利用SMOTE算法对归一化后的带钢热轧过程特征变量中的少数类进行数据合成,使正常状态数据和故障数据保持预设比例,以克服数据非平衡的问题。
[0018]进一步地,训练深度置信网络,对预处理后的正常数据集和故障数据集中的带钢热轧过程特征变量分别进行特征提取,并进行类型标注,以构建新的样本数据集,包括:
[0019]设置深度置信网络中每个受限玻尔兹曼机网络参数值,并以均方根误差作为衡量训练性能的指标;
[0020]根据均方根误差指标进行对比,确定深度置信网络中的受限玻尔兹曼机的堆叠层数和对应的节点数;
[0021]利用确定好的网络结构对预处理后的正常数据集和故障数据集中的带钢热轧过程特征变量分别进行特征提取,并进行相应的类别标注;按比例选取相应的正常样本特征和故障样本特征,构成新的样本数据集。
[0022]进一步地,利用所述新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对待分类带钢热轧过程数据进行故障分类,包括:
[0023]将所述新的样本数据集按照一定比例随机划分成训练集和测试集;
[0024]利用所述训练集训练AdaBoost分类模型:首先训练出一个弱学习器,根据弱学习器的误差率更新训练样本的权重,然后基于调整权重后的训练集训练出第二个弱学习器,直到弱学习器的数目达到事先指定的数目,停止算法;
[0025]利用训练好的AdaBoost分类模型对所述测试集中的测试样本进行分类。
[0026]进一步地,预设的评估方式为Precision、Recall以及F1分数中的任意一种或多种的组合;在上述评估方式的基础上,进一步结合故障检测图和贡献图结果验证故障分类和故障定位的准确性。
[0027]另一方面,本专利技术还提供了一种基于集成学习的带钢热轧过程故障分类装置,所述基于集成学习的带钢热轧过程故障分类装置包括:
[0028]历史样本数据库构建模块,用于获取带钢热轧过程中产生的历史样本数据,建立历史样本数据库;其中,所述历史样本数据包括正常运行时的带钢热轧过程特征变量所组成的正常数据集,以及出故障时的带钢热轧过程特征变量及历史故障维修信息所组成的故障数据集;数据预处理模块,用于对所述历史样本数据库构建模块所构建的历史样本数据库中不同数据集中的数据分别进行数据预处理;
[0029]特征提取模块,用于训练深度置信网络,对经过所述数据预处理模块预处理后的
正常数据集和故障数据集中的带钢热轧过程特征变量分别进行特征提取,并进行类型标注,以构建新的样本数据集;
[0030]故障分类与故障变量定位模块,用于利用所述特征提取模块所构建的新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对待分类带钢热轧过程数据进行故障分类,并结合历史故障维修信息定位故障变量。
[0031]再一方面,本专利技术还提供了一种电子设备,其包括处理器和存储器;其中,存储器中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。
[0032]又一方面,本专利技术还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令,所述指令由处理器加载并执行以实现上述方法。
[0033]本专利技术提供的技术方案带来的有益效果至少包括:
[0034]本专利技术通过建立历史样本数据库,对数据进行归一化后得到建模所用数据集。针对带钢热轧过程本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于集成学习的带钢热轧过程故障分类方法,其特征在于,包括:获取带钢热轧过程中产生的历史样本数据,建立历史样本数据库;其中,所述历史样本数据包括正常运行时的带钢热轧过程特征变量组成的正常数据集和出故障时的带钢热轧过程特征变量及历史故障维修信息组成的故障数据集;对所述历史样本数据库中不同数据集中的数据分别进行数据预处理;训练深度置信网络,对预处理后的正常数据集和故障数据集中的带钢热轧过程特征变量分别进行特征提取,并进行类型标注,以构建新的样本数据集;利用所述新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对待分类带钢热轧过程数据进行故障分类,并结合历史故障维修信息定位故障变量。2.如权利要求1所述的基于集成学习的带钢热轧过程故障分类方法,其特征在于,在利用所述新的样本数据集训练AdaBoost分类模型,利用训练后的分类模型对待分类带钢热轧过程数据进行故障分类之后,所述方法还包括:采用预设的评估方式对训练后的分类模型进行评估。3.如权利要求1所述的基于集成学习的带钢热轧过程故障分类方法,其特征在于,所述历史样本数据库中包括正常运行时的带钢热轧过程正常数据集和多种不同类型的故障所对应的故障数据集;所述历史样本数据库中每一数据集均包括相同的带钢热轧过程特征变量。4.如权利要求1所述的基于集成学习的带钢热轧过程故障分类方法,其特征在于,对历史样本数据库中不同数据集中的数据分别进行数据预处理,包括:采用滑动窗口算法对带钢热轧过程特征变量平滑化;采用Z

score算法对平滑后的带钢热轧过程特征变量进行归一化;其中,归一化后每个带钢热轧过程特征变量列对应的均值为0,方差为1;利用SMOTE算法对归一化后的带钢热轧过程特征变量中的少数类进行数据合成,使正常状态数据和故障数据保持预设比例,以克服数据非平衡的问题。5.如权利要求1所述的基于集成学习的带钢热轧过程故障分类方法,其特征在于,训练深度置信网络,对预处理后的正常数据集和故障数据集中的带钢热轧过程特征变量分别进行特征提取,并进行类型标注,以构建新的样本数据集,包括:设置深度置信网络中每个受限玻尔兹曼机网络参数值,并以均方根误差作为衡量训练性能的...

【专利技术属性】
技术研发人员:彭开香杨婕董洁
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1