一种基于Stacking的边缘侧业务行为识别方法技术

技术编号:27458640 阅读:23 留言:0更新日期:2021-02-25 05:08
本发明专利技术提出的是一种基于Stacking集成的边缘侧业务行为识别方法。该方法包含:获取边缘侧行为特征,根据边缘侧行为特征对边缘侧行为进行标签化定义,获取边缘侧行为特征数据库,构建基于PCA以及Stacking集成框架的边缘侧行为识别模型。PCA算法能够将高维的边缘侧行为特征数据库进行特征工程处理,获得模型算法所需要的优良数据。Stacking集成算法通过基模型对数据库的进一步处理,得到新的数据集供次级学习器进行训练,能够大幅度提高识别准确率,并且避免过拟合的问题。该发明专利技术方法能够对边缘侧数据行为进行建模,能对边缘侧行为动作高效识别。高效识别。高效识别。

【技术实现步骤摘要】
一种基于Stacking的边缘侧业务行为识别方法


[0001]本专利技术属于工业控制网络信息安全领域,具体说是一种基于Stacking集成的边缘侧业务行为识别方法。

技术介绍

[0002]目前国内外关于基于行业特征知识库的边缘侧行为检测技术的研究比较空白,现在边缘侧设备行为检测及建模方法都是基于机器学习算法的。现在用于边缘侧设备行为检测的方法有基于支持向量机的检测,它的数据空间与时间代价比较大,需要大量的存储空间对多种动作状态识别效果不太好;基于朴素贝叶斯方法的行为状态检测,在特征个数较多以及特征之间相关性较大时,设备动作识别准确度较低;基于决策树算法的检测预测结果不稳定,方差较大,会导致设备动作识别错误。

技术实现思路

[0003]本专利技术目的是提供一种面向边缘侧业务行为识别方法。通过追踪检测边缘侧设备的输出数据,判断云范围内设备是否发生故障,以及故障报警机制。
[0004]本专利技术为实现上述目的所采用的技术方案是:
[0005]一种基于Stacking的边缘业务行为识别方法,包括以下步骤:
[0006]获取边缘侧设备行为数据,并对边缘侧设备行为数据进行预处理;
[0007]使用集成规则树模型对预处理后的边缘侧设备行为数据进行特征选择;
[0008]使用Stacking框架构建集成学习边缘侧行为识别模型,并将特征选择后的边缘侧设备行为数据作为模型输入,通过模型训练,根据模型预测结果,得到当前时刻边缘侧设备的动作行为状态。
[0009]所述边缘侧设备行为数据包括:时间,设备状态,动作状态的特征维度
[0010]所述边缘侧设备行为数据进行预处理为使用PCA降维的方法对边缘侧设备行为数据进行降维,具体为:
[0011]对边缘侧设备行为数据进行归一化处理;
[0012]计算归一化后的边缘侧设备行为数据中特征间的协方差矩阵;
[0013]计算归一化后的边缘侧设备行为数据中特征的特征值和特征向量;
[0014]将特征值从大到小排列,从最大特征值开始,选取k个特征值,得到k维的边缘侧设备行为数据,根据特征值计算得到的k个特征向量的集合即为降维后的边缘侧设备行为数据。
[0015]所述使用Stacking框架构建集成学习边缘侧设备行为识别模型具体为:
[0016]将边缘侧设备行为数据分为训练集与测试集,对训练集采取K折交叉验证的方式对基模型进行训练;
[0017]使用训练集对基学习器进行训练,输出的预测值作为新的样本的一个特征,K折交叉验证得到K个特征,将得到的所有特征作为次级学习器的输入继续训练;测试集通过基学
习器训练产生新的测试集供次级学习器预测;
[0018]选取随机森林算法,Adaboost算法以及K-近邻算法即KNN算法用作基学习器;使用线性回归算法用作次级学习器,通过Stacking方法将基学习器模型与次级学习器模型进行集成;训练集经过三个基学习器训练,输出新的数据特征作为次级学习器的输入,新的训练集通过次级学习验证得到最终的预测结果。
[0019]所述随机森林算法具体为:
[0020]从训练集或测试集中通过bootstrap方法进行自采样,得到新的训练集或测试集,根据新的训练集或测试集构建决策树;
[0021]建立特征随机子集合:在决策树进行节点分裂时,从全部特征中随机抽取若干个特征构成特征随机子集合,在该子集合中寻找满足设定要求的特征建立决策树;
[0022]对构建的多棵决策树的预测结果进行多数投票,少数服从多数,得到最终预测结果即工控设备的此刻动作状态。
[0023]所述Adaboost算法具体为:
[0024]初始化训练集中的样本权重,设有m个样本,则每个样本权重为1/m;
[0025]循环训练基学习器,若样本已经满足设定的分类条件,则在构造下一个训练集时,降低该样本权重;若某个样本不满足设定的分类条件,则提高该样本权重,更新过权重的训练集被用于训练下一个基学习器;
[0026]判断基学习器的准确率是否达到50%,若准确率低于50%,则该基学习器被抛弃,否则,保留该基学习器;
[0027]循环训练过程,直到基学习的数量达到事先的指定值;
[0028]将训练得到的若干基学习器组合成强学习器。
[0029]一种基于Stacking的边缘业务行为识别系统,包括:
[0030]数据获取模块,用于获取边缘侧设备行为数据;
[0031]特征选择模块,用于使用集成规则树模型对所述边缘侧设备行为数据进行特征选择;
[0032]模型训练模块,用于使用Stacking框架构建集成学习边缘侧行为识别模型,并将特征选择后的边缘侧设备行为数据作为模型输入,通过模型训练,根据模型预测结果,得到当前时刻边缘侧设备的动作行为状态。
[0033]所述模型训练模块包括基学习器和次级学习器,其中,随机森林算法,Adaboost算法以及K-近邻算法即KNN算法用作基学习器,线性回归算法用作次级学习器,通过Stacking方法将基学习器模型与次级学习器模型进行集成;训练集经过三个基学习器训练,输出新的数据特征作为次级学习器的输入,新的训练集通过次级学习验证得到最终的预测结果。
[0034]所述数据获取模块中的边缘侧设备行为数据包括:时间,设备状态,动作状态的特征维度。
[0035]所述特征选择模块用于:
[0036]对边缘侧设备行为数据进行归一化处理;
[0037]计算归一化后的边缘侧设备行为数据中特征间的协方差矩阵;
[0038]计算归一化后的边缘侧设备行为数据中特征的特征值和特征向量;
[0039]将特征值从大到小排列,从最大特征值开始,选取k个特征值,得到k维的边缘侧设
备行为数据,根据特征值计算得到的k个特征向量的集合即为降维后的边缘侧设备行为数据。
[0040]所述模型训练模块用于:
[0041]将边缘侧设备行为数据分为训练集与测试集,对训练集采取K折交叉验证的方式对基模型进行训练;
[0042]使用训练集对基学习器进行训练,输出的预测值作为新的样本的一个特征,K折交叉验证得到K个特征,将得到的所有特征作为次级学习器的输入继续训练;测试集通过基学习器训练产生新的测试集供次级学习器预测;
[0043]选取随机森林算法,Adaboost算法以及K-近邻算法即KNN算法用作基学习器;使用线性回归算法用作次级学习器,通过Stacking方法将基学习器模型与次级学习器模型进行集成;训练集经过三个基学习器训练,输出新的数据特征作为次级学习器的输入,新的训练集通过次级学习验证得到最终的预测结果。
[0044]本专利技术具有以下有益效果及优点:
[0045]1.本专利技术针对边缘侧设备业务的行为识别问题,提出的一种基于集成学习学习方法框架的边缘侧设备业务行为识别方法,使用PCA与集成规则树和随机森林Adaboost,KNN,逻辑回归等学习算法本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于Stacking的边缘业务行为识别方法,其特征在于,包括以下步骤:获取边缘侧设备行为数据;使用集成规则树模型对所述边缘侧设备行为数据进行特征选择;使用Stacking框架构建集成学习边缘侧行为识别模型,并将特征选择后的边缘侧设备行为数据作为模型输入,通过模型训练,根据模型预测结果,得到当前时刻边缘侧设备的动作行为状态。2.根据权利要求1所述的一种基于Stacking的边缘业务行为识别方法,其特征在于,所述边缘侧设备行为数据包括:时间,设备状态,动作状态的特征维度。3.根据权利要求1所述的一种基于Stacking的边缘业务行为识别方法,其特征在于,在获取边缘侧设备行为数据之后,还包括:对边缘侧设备行为数据进行归一化处理;计算归一化后的边缘侧设备行为数据中特征间的协方差矩阵;计算归一化后的边缘侧设备行为数据中特征的特征值和特征向量;将特征值从大到小排列,从最大特征值开始,选取k个特征值,得到k维的边缘侧设备行为数据,根据特征值计算得到的k个特征向量的集合即为降维后的边缘侧设备行为数据。4.根据权利要求1所述的一种基于Stacking的边缘业务行为识别方法,其特征在于,所述使用Stacking框架构建集成学习边缘侧设备行为识别模型具体为:将边缘侧设备行为数据分为训练集与测试集,对训练集采取K折交叉验证的方式对基模型进行训练;使用训练集对基学习器进行训练,输出的预测值作为新的样本的一个特征,K折交叉验证得到K个特征,将得到的所有特征作为次级学习器的输入继续训练;测试集通过基学习器训练产生新的测试集供次级学习器预测;选取随机森林算法,Adaboost算法以及K-近邻算法即KNN算法用作基学习器;使用线性回归算法用作次级学习器,通过Stacking方法将基学习器模型与次级学习器模型进行集成;训练集经过三个基学习器训练,输出新的数据特征作为次级学习器的输入,新的训练集通过次级学习验证得到最终的预测结果。5.根据权利要求4所述的一种基于Stacking的边缘业务行为识别方法,其特征在于,所述随机森林算法具体为:从训练集或测试集中通过bootstrap方法进行自采样,得到新的训练集或测试集,根据新的训练集或测试集构建决策树;建立特征随机子集合:在决策树进行节点分裂时,从全部特征中随机抽取若干个特征构成特征随机子集合,在该子集合中寻找满足设定要求的特征建立决策树;对构建的多棵决策树的预测结果进行多数投票,少数服从多数,得到最终预测结果即工控设备的此刻动作状态。6.根据权利要求4所述的一种基于Stacking的边缘业务行为识别方...

【专利技术属性】
技术研发人员:刘贤达王昆昆赵剑明陈春雨张厦千王天宇张博文
申请(专利权)人:国网江苏省电力有限公司信息通信分公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1