当前位置: 首页 > 专利查询>枣庄学院专利>正文

基于空间域转换独立树的可控中高压光机异常检测方法技术

技术编号:29676004 阅读:30 留言:0更新日期:2021-08-13 21:58
本发明专利技术公开一种基于空间域转换独立树的可控中高压光机异常检测方法,本方法利用高斯核函数将压光机运行状态数据映射至特征空间中,将局部异常转化为全局异常;在此基础上,构建独立树模型对核化后的数据集进行异常检测。对如何选择最佳划分特征和划分样本值的问题,本系统提出一种最佳划分特征和划分样本值选择策略策略。在保持检测全局异常能力的基础上,也提高了压光机运行状态数据的局部异常点的检测精度。

【技术实现步骤摘要】
基于空间域转换独立树的可控中高压光机异常检测方法
本专利技术涉及压光机设备故障异常检测领域,具体是一种基于空间域转换独立树的可控中高压光机异常检测方法。
技术介绍
可控中高压光机系列装备(包括软辊压光机、非织造布热轧机及压花机,以下简称压光机)不仅是造纸行业的重要高端装备,也是熔喷布(医用口罩的核心材料)、反渗透膜(海水淡化、净水机)等当前新兴产业的高价值核心设备,其技术结构复杂、价值高、是智能制造产业链的关键节点。压光机的结构由机架、软辊、热辊、刮刀、引纸系统、弧形辊、张力辊、软辊端部温控系统、软辊胶面温控系统、传动系统、液压系统、热油系统、应力感知与控制系统、间距感知与控制系统、扭矩平衡及控制系统等众多子系统构成,每个子系统存在或相对独立或相互关联的部件,其运行状态的监测变量高达百余个,且变量的结构各异(包含离散、连续、振动、音频和视频等)、量纲不统一、范围大小不一致,在24小时不停机的生产过程中将产生海量的监测数据(单台设备不低于10GB/天),是工业大数据的典型代表。压光机运行状态与温度、摩擦、应力、材料等各种因素有关,涉及温控、润滑、液压、扭矩等各种部件,运维难度高、需要专业的工作人员进行长时间的维护与保养,然而仅依靠人力对可控中高压光机作业过程中可能产生的一系列机械故障进行检测,其检测准确率低、效率低。且压光机运行状态之间存在较为复杂的驱动关系,即单个故障可能导致连锁效应。如果不及时控制部件状态退化,可能导致关键部件损坏,造成设备停机,产生比预测性维护费用高数十倍的维修成本及停机损失,危及整个生产线,对于24小时不停机的现代制造工厂来说,其带来的间接损失更是难以估算。可控中高压光机的部件众多、监测变量维度高,且在其全生命周期中,运行状态会随着负载变化、材料类型和部件老化发生改变,为其运行时异常状态判断,故障发生和扩散诊断、预测性维护优化带来了严峻挑战。为了能够及时准确地的发现压光机运行时的异常状态,开发针对压光机的智能故障预测维护系统,有效避免故障停机带来的直接和间接损失,并有助于降低设备运维成本,提升装备价值和使用寿命,促进产品质量的长期提升及降低设备故障率,增加设备运行稳定性及产品质量标准稳定,增加产能,具有极大意义。目前,国内外针对压光机设备运行状态的异常检测方法主要分为基于统计、基于距离、基于机器学习等。基于统计的异常检测方法利用原有数据估计一个统计模型来检测异常,该模型能够捕捉数据的分布,并评估数据实例与模型的匹配程度,如果通过该模型生成的数据实例的概率非常低,则该数据实例被定义为异常。利用统计学方法对数据做异常检测是标准统计学方法的一种有效应用。该方法的优点是,当数据和检验类型内容足够时,此检测方法会非常有效;缺点是,这种方法主要仅适用于单个属性的数据,不适用于多维属性数据。基于距离的异常检测方法,通过在压光机重要机械节点部署传感器,采集压光机运行状态的数据,利用距离相似性(例如欧式距离)度量不同时间节点压光机各个部位的数据信息,如果某些时间节点数据与其它时间节点相比,具有明显差异,那么判断该时间节点机械装置出现异常。该方法的优点是使用距离来测量数据对象之间的相近度,该方法更简单,更易于使用;缺点是对大规模高维数据的处理效率明显下降,因为数据集规模的变大会导致算法的时间复杂度呈指数级增长。基于机器学习的方法大致分为分类、聚类两种。基于分类的方法通过将数据分为正常数据和异常数据两类来区分出异常数据。基于聚类的方法通常采用聚类算法将数据集分为两个或多个聚类簇,然后依据每个簇的大小和簇内的数据距离筛选异常数据点,该算法通常利用节点与邻域的时空相关性进行检测。但是,目前国内外广泛使用的基于统计和距离的方法存在一些缺点:基于统计的方法依据标准统计学原理,当构建的数学模型符合压光机运行状态数据集的真实变化规律时,就能快速地检测出数据集中存在的异常,并以此来判断出异常出现的原因。但是实际上,大多数情况下都难以明确数据集的分布规律,实际数据集往往也不完全符合某种理想状态的数学模型,因此这种方法存在局限性,尤其当数据量大且分布复杂的情况下,估计数据的分布状况是极其困难的。另外,这种方法依赖于压光机运行状态的正常数据落在模型的高概率区间,异常数据相对处于低概率区间的假设,检测时也必定存在一定的误报率和漏报率。基于距离的方法处理大数据分段时的效率不高,检测效果往往不如其他检测方法,故通常被用作异常点的判定策略融入到其他检测方法中。以上两种方法针对局部异常数据检测,其检测准确率偏低。
技术实现思路
本专利技术要解决的技术问题是提供一种基于空间域转换独立树的可控中高压光机异常检测方法,采用核函数空间域转换实例算法(KernelLocality-sensitivehashing,KLSH)和独立树算法(isolatedtree,itree)相融合的方式应用于压光机运行状态异常检测中,解决了压光机运行状态数据的局部异常检测问题,也避免了使用基于统计和距离的方法在压光机运行状态数据中局部异常数据检测率低的问题。为了解决所述技术问题,本专利技术采用的技术方案是:一种基于空间域转换独立树的可控中高压光机异常检测方法,其特征在于:包括以下步骤:S01)、在压光机的重要、易发生故障的部位部署状态监测传感器,传感器监测压光机运行状态下各重要或易发生故障的部位的状态信息,并将采集的状态信息传输至计算机终端,进行数据存储,形成时间序列数据集;S02)、无效数据删除、数据归一化,将压光机运行状态数据集XT通过第一四分位数法删除无效数据,然后利用z-score方法进行归一化处理,得到新数据集X;S03)、随机不重复子采样,使用随机不重复子采样技术,对经过预处理后的压光机运行状态数据集X进行子采样,得到nt个压光机运行状态样本子集Si,i∈[1,nt],nt为构建独立树的数量;S04)、核函数化,由压光机运行状态数据集X创建nt+1个核函数空间域转换实例,任意选择一个核函数空间域转换实例对数据集X进行核函数化,得到核化压光机运行状态数据集Xk,使用剩余的nt个核函数空间域转换实例对压光机运行状态样本子集进行核函数化,得到nt个核化压光机运行状态样本子集Si,i∈[1,nt];S05)、计算特征均值,分别计算核化压光机运行状态数据集Xk和每一个核化压光机运行状态样本子集Si的特征均值;S06)、选择最佳划分特征和划分样本值,比较核化压光机运行状态样本子集Si的特征均值与核化压光机运行状态数据集Xk的特征均值,选出均值差最大的特征作为构建独立树算法模型的最佳划分特征,最佳划分特征所对应的子样本数据集Si的特征均值作为划分样本值;S07)、独立树算法根据最佳划分特征和划分样本值来划分压光机运行状态数据集,构建itree树,并根据itree树的提前截止限制高度值来提前结束树的构建过程;S08)、将压光机运行状态实时感知数据经归一化、核函数空间域转换实例核函数化后,依次放入构建的itree树中,计算每个数据点的路径长度、异常得分;S09)、将异常得分与本文档来自技高网
...

【技术保护点】
1.一种基于空间域转换独立树的可控中高压光机异常检测方法,其特征在于:包括以下步骤:/nS01)、在压光机的重要、易发生故障的部位部署状态监测传感器,传感器监测压光机运行状态下各重要或易发生故障的部位的状态信息,并将采集的状态信息传输至计算机终端,进行数据存储,形成时间序列数据集;/nS02)、无效数据删除、数据归一化,将压光机运行状态数据集X

【技术特征摘要】
1.一种基于空间域转换独立树的可控中高压光机异常检测方法,其特征在于:包括以下步骤:
S01)、在压光机的重要、易发生故障的部位部署状态监测传感器,传感器监测压光机运行状态下各重要或易发生故障的部位的状态信息,并将采集的状态信息传输至计算机终端,进行数据存储,形成时间序列数据集;
S02)、无效数据删除、数据归一化,将压光机运行状态数据集XT通过第一四分位数法删除无效数据,然后利用z-score方法进行归一化处理,得到新数据集X;S03)、随机不重复子采样,使用随机不重复子采样技术,对经过预处理后的压光机运行状态数据集X进行子采样,得到nt个压光机运行状态样本子集Si,i∈[1,nt],nt为构建独立树的数量;
S04)、核函数化,由压光机运行状态数据集X创建nt+1个核函数空间域转换实例,任意选择一个核函数空间域转换实例对数据集X进行核函数化,得到核化压光机运行状态数据集Xk,使用剩余的nt个核函数空间域转换实例对压光机运行状态样本子集进行核函数化,得到nt个核化压光机运行状态样本子集Si,i∈[1,nt];
S05)、计算特征均值,分别计算核化压光机运行状态数据集Xk和每一个核化压光机运行状态样本子集Si的特征均值;
S06)、选择最佳划分特征和划分样本值,比较核化压光机运行状态样本子集Si的特征均值与核化压光机运行状态数据集Xk的特征均值,选出均值差最大的特征作为构建独立树算法模型的最佳划分特征,最佳划分特征所对应的子样本数据集Si的特征均值作为划分样本值;
S07)、独立树算法根据最佳划分特征和划分样本值来划分压光机运行状态数据集,构建itree树,并根据itree树的提前截止限制高度值来提前结束树的构建过程;
S08)、将压光机运行状态实时感知数据经归一化、核函数空间域转换实例核函数化后,依次放入构建的itree树中,计算每个数据点的路径长度、异常得分;
S09)、将异常得分与阈值进行比较,决定数据点是否为异常点,如果出现数据异常,压光机停止工作,由设备维护人员进行相应的故障排查和维护工作。


2.根据权利要求1所述的基于空间域转换独立树的可控中高压光机异常检测方法,其特征在于:步骤S04中,将压光机运行状态数据由原始空间映射到高维空间采用了基于高斯核函数的空间域转换实例算法,公式为:

其中φ(x)是映射函数,是随机超平面,是中心化核矩阵,eζ是Si*1的向量,ζ是随机投影,其中的ζ的取值为min(si/4,30),k(x,xi)是核函数,核函数使用高斯核函数公式,由可调参数γ控制核函数的宽度,高斯核函数通过以下公式表示:
K(xi,xj)=exp(-γ||xi-xj||2)(3)。


3.根据权利要求1所述的基于空间域转换独立树的可控中高压光机异常检测方法,其特征在于:步骤S05中,将当前高度与提前截止限制高度值比较,若满足条件,则建树完成,否则,计算核化后的压光机运行状态数据集Xk的特征均值avgi,再计算nt个核化后的压光机运行状态子样本数据集Si的特征均值sub_avgi;
其中,计算提前截止限制高度值的公式如下:H=2log2(len(Si))+0.832...

【专利技术属性】
技术研发人员:屈洪春胡安明刘光辉宋传东曹旨昊姜振凤
申请(专利权)人:枣庄学院山东明源智能装备科技有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1