一种变电站故障数据诊断中的随机森林分类方法技术

技术编号：27367919 阅读：58 留言：0更新日期：2021-02-19 13:52

一种变电站故障数据诊断中的随机森林分类方法，从变电站故障诊断系统中提取数据，对数据进行预处理，得到原始样本集，包括以下步骤：(1)建立随机森林模型；(2)对原始随机森林模型进行重要性分析；(3)对原始样本集进行处理，保留结果与所选出的特征，生成新的样本集，同时对测试集进行相同处理；(4)使用新样本集，重复步骤(1)得到最终随机森林模型；(5)利用测试集对随机森林模型进行测试，评估模型性能；(6)用随机森林分类器对新的数据进行判别与分类，分类结果按树分类器的投票多少而定，并将分类结果储存到数据库中。本发明专利技术减少了大量的实时数据处理量，加快系统分类速度，保证决策系统实时性；分类性能好；避免过拟合。避免过拟合。避免过拟合。

全部详细技术资料下载

【技术实现步骤摘要】
一种变电站故障数据诊断中的随机森林分类方法

[0001]本专利技术涉及一种变电站故障数据诊断中的随机森林分类方法。

技术介绍

[0002]现有技术中，当电网发生故障时，监控设备会及时产生报警信息并上传，例如开关跳闸、自动保护装置动作、欠电压、过电流、设备过负荷等这些信息。特别是当一些结构、规模巨大的电力系统出现故障时，一时间系统会产生大量的报警信息，而这些信息中包括大量的由保护或断路器误动、拒动，信道传输干扰错误，保护动作时间偏差等因素造成的不确定性的知识和数据。目前国内外提出了许多变电站故障数据诊断的技术和方法主要有专家系统、人工神经网络、优化算法技术、petri网络、模糊集理论、粗糙集理论等。以上智能技术在应用于故障诊断时各有不同优点，但同时也暴露出许多的问题。例如专家系统的维护难度高，容错性差；人工神经网络缺乏对自身行为的解释能力，同时需要大量训练样本等。目前已有的变电站故障数据诊断分类方法存在问题，无法同时保证准确率与效率，而在现实变电站故障诊断系统的使用中，对诊断速度与准确率的要求都较高。

技术实现思路

[0003]为了克服现有技术的不足，本专利技术提供一种变电站故障数据诊断项目中的随机森林分类方法，在决策树的基础上采用集成学习的思想，通过随机选择样本和随机选择特征进行训练生成随机森林，并通过随机森林对数据分类。
[0004]本专利技术解决其技术问题所采用的技术方案是：
[0005]一种变电站故障诊断项目中的随机森林分类方法，从变电站故障诊断系统中提取数据，对数据进行预处理，...

【技术保护点】

【技术特征摘要】
1.一种变电站故障数据诊断中的随机森林分类方法，其特征在于，从变电站故障诊断系统中提取数据，对数据进行预处理，得到原始样本集，所述方法包括以下步骤：(1)建立随机森林模型，过程如下：(1.1)设T为原始样本集，其中总共有n个样例，则每轮从原始样本集T中通过Bootstrapin的方式抽取n个样例，得到一个大小为n的训练集T
i
，在原始样本集的抽取过程中，可能有被重复抽取的样例，也可能有一次都没有被抽到的样例。共进行k轮的抽取，则每轮抽取的训练集分别为T1,T2,
…
,T
k
，未被包含的数据被称为袋外数据；(1.2)建立决策树；(1.3)重复步骤(1.1)和(1.2)，直到所有CART树都经过训练，组合所有决策树，构建成原始随机森林模型；(2)对原始随机森林模型进行重要性分析，指定L＝|sqrt(M)|选取排名前L个特征；(3)对原始样本集T进行处理，保留结果与所选出的特征，生成新的样本集Y，同时对测试集...

【专利技术属性】
技术研发人员：蒋一波，冯缘，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人