一种工控数据特征重排序算法的自适应确定方法技术

技术编号：30550809 阅读：29 留言：0更新日期：2021-10-30 13:31

本发明专利技术涉及一种工控数据特征重排序算法的自适应确定方法，通过基于不同特征重排序算法对数据集进行特征选择；基于机器学习算法对重排序后的数据集进行训练记录准确率、召回率和时间，并对数据集计算预设评价指标，以生成相应的指标数据集合；对指标数据集合使用机器学习算法建立选择最优重排序算法的决策树；并使用决策树对输入的目标数据集的指标数据进行处理，以得到和目标数据集相匹配的特征重排序算法。实现了能够自动挑选出和目标数据集匹配度最好的特征重排序算法，从而提高了数据集特征重排序算法的准确度和效率，为工控数据的异常检测提供了保证。异常检测提供了保证。异常检测提供了保证。

全部详细技术资料下载

【技术实现步骤摘要】
一种工控数据特征重排序算法的自适应确定方法

[0001]本专利技术属于数据安全
，具体涉及一种工控数据特征重排序算法的自适应确定方法。

技术介绍

[0002]在工控领域中，随着互联网技术的逐渐成熟，工控网络越来越多地与互联网相联通，这使得工控网络极易受到攻击。
[0003]现有针对工控数据实时监控的异常检测算法多采用机器学习算法和神经网络算法。但实际工控环境复杂在采集数据时存储顺序随机，采集到的数据维度间关联具有不确定性。如相邻维度可能是无关参数或无关设备，而相关设备或参数物理距离远等情况。以上这些问题加大了异常检测算法的学习难度，算法的学习效率有待进一步提高。而实际情况中存在不同的工控环境，采集到的数据集都不相同，为每个数据集寻找适用特征选择算法重复工作量大，实现同一类型的数据集直接匹配特征选择算法，去除重复运算也刻不容缓。

技术实现思路

[0004]为了解决现有技术存在的效率低的问题，本专利技术提供了一种工控数据特征重排序算法的自适应确定方法，其具有提高了数据集特征重排序的准确度和效率，为工控数据的异常检测提供了保证等特点。
[0005]根据本专利技术的具体实施方式的一种工控数据特征重排序算法的自适应确定方法，包括：
[0006]基于不同特征选择算法对数据集进行特征重排序；
[0007]基于机器学习算法对重排序后的数据集进行训练记录准确率、召回率和时间，并对数据集计算预设评价指标，以生成相应的指标数据集合；
[0008]基于所述指标数据集合使用机器学习...

【技术保护点】

【技术特征摘要】
1.一种工控数据特征重排序算法的自适应确定方法，其特征在于，包括：基于不同特征选择算法对数据集进行特征重排序；基于机器学习算法对重排序后的数据集进行训练记录准确率、召回率和时间，并对数据集计算预设评价指标，以生成相应的指标数据集合；基于所述指标数据集合使用机器学习算法建立选择最优重排序算法的决策树；基于所述决策树对输入的目标数据集的指标数据进行判断，以得到和所述目标数据集相匹配的特征重排序算法。2.根据权利要求1所述的工控数据特征重排序算法的自适应确定方法，其特征在于，基于机器学习算法对重排序后的数据集进行训练记录Acc、Recall和时间，并对数据集计算预设评价指标，以生成相应的指标数据集合包括：基于预设数据集相关参数对数据集进行计算，基于特征选择结果参数对特征选择结果进行计算以生成所述指标数据集合。3.根据权利要求2所述的工控数据特征重排序算法的自适应确定方法，其特征在于，所述数据集相...

【专利技术属性】
技术研发人员：刘学君，孔祥旻，张小妮，沙芸，晏涌，王文晖，曹雪莹，李凯丽，
申请(专利权)人：北京石油化工学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人