System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种配网故障分析方法,具体是一种基于大数据的配网故障分析方法。
技术介绍
1、伴随着国家经济的发展、科技的进步,一方面,用户生活水平逐年提高,各式家用电器成为用电主力,新能源汽车迎来爆发式增长,使得近年来用户用电量不断攀升。另一方面,因配网的重视度不够,使得配网基础建设跟不上城镇化建设发展步伐,特别是农网的历史遗留原因,使得配网故障时有发生。
2、随着数据中心、大数据平台的建设完善,已集成生产、调度、营销等业务部门的实时监测数据及相关业务数据,其中包括用电采集系统、d5000、pms3.0等业务数据,并已实现各业务系统的数据贯通,数据量开始从gb级迈入tb级。
3、面对已经积累到的海量数据,如何更好的挖掘、展现数据潜在的业务价值规律,进一步分析配网运行特点,研究故障成因及规律,提取造成故障的关键因素,进而研究故障发生的原因及辅助决策,提供故障的预警及趋势分析,充分发挥大数据平台中海量数据的实际价值,为配网故障治理提供数据支撑,已经成为非常迫切的问题。
技术实现思路
1、针对以上情况,本专利技术的目的是提供一种基于大数据的配网故障分析方法,以电网大数据平台业务数据为基础,通过数据处理,神经网络算法实现对配网故障分析的方法。该方法在测试数据集上有良好的表现,在实际故障样本组成的验证数据集上,模型具有良好的分类准确度,有效性好。
2、本专利技术的目的通过以下技术方案实现:
3、一种基于大数据的配网故障分析方法,其特征在于,包括
4、步骤一,获取配网故障数据并进行数据清洗,对配网故障数据进行初步分析:
5、获取配网故障数据来源不同的业务系统,数据格式、故障描述维度均不统一,通过数据筛选、归一化处理并通过均值填充法填补缺失值获取配网故障数据集;通过数据集利用k-means聚类算法进行聚类分析获取实际故障类别;
6、步骤二,训练2d-cnn深度神经网络完成配网故障分类模型:
7、2d-cnn深度神经网络利用卷积层挖掘多维风险指标的事故特征,通过增加网络计算深度,有效提高配网故障等级的多分类预测精度;模型采用监督学习的训练方式,训练过程分为前向训练和反向训练两个阶段,首先确定二维卷积神经网络的结构,设置初始参数和迭代次数,将结构重组后二维形式的特征矩阵作为模型的输入,并进行前向训练,模型的训练样本中配网故障预测结果与实际值进行对比得到预测准确率;然后进行反向传播,使用优化算法不断更新权重矩阵,从而提高模型的预测准确率;
8、步骤三:使用测试数据集对模型进行测试,验证模型效果,得到最优配网故障分类预测模型,实现配网故障分析。
9、本专利技术步骤一中,利用k-means聚类算法对原始故障数据集d通过聚类得到故障类别:
10、k-means聚类算法对原始故障类型进行分类,将数据集d划分为k类,则其ch分数s被定义为簇间离散度与簇内离散度的比值,根据隶属度矩阵确定配网故障类型;
11、ch分数是数据集的分离度与紧密度的比值,通过计算类中各点与类中心的距离平方和来度量类内的紧密度,通过计算各类中心点与数据集中心点距离平方和来度量数据集的分离度;ch越大表示类自身越紧密,类与类之间越分散,即聚类结果更优;
12、聚类算法通过ch分数优化故障数据聚类结果,ch分数计算过程如下:
13、
14、
15、
16、其中:wk为簇内离散矩阵;bk为簇间离散矩阵;nd为数据集d的样本点数;cd为数据集d的中心点;cq为聚类集q的点集;cq为聚类集q的中心点;nq为聚类集q的样本点数;tr表示矩阵的迹。
17、步骤二中,利用信息增益筛选形成新的风险指标:
18、业务系统中存储大量故障相关信息,为降低网络复杂度,提升模型训练速度,通过计算信息增益对变量进行特征选择,当变量的信息增益值越大时,表明变量对分类做出的贡献越多,即变量的重要程度越高;
19、2d-cnn深度神经网络利用卷积层挖掘多维风险指标的事故特征,通过增加网络计算深度,有效提高配网故障等级的多分类预测精度,其主要结构包括卷积层、池化层、输出层3个部分。模型采用监督学习的训练方式,训练过程分为前向训练和反向训练两个阶段。首先确定二维卷积神经网络的结构,设置初始参数和迭代次数,将结构重组后二维形式的特征矩阵作为模型的输入,并进行前向训练,模型的训练样本中配网故障预测结果与实际值进行对比得到预测准确率;然后进行反向传播,使用优化算法不断更新权重矩阵,从而提高模型的预测准确率。
20、2d-cnn神经网络由1d-cnn网络优化而来,假设1d-cnn模型卷积核的维度m=4,对应2d-cnn模型卷积核的维度m×m=2×2。2d-cnn模型卷积层的计算公式可表示为:
21、
22、式中yk,j表示第k个特征面的第j个神经元的输出值;wk,s,t表示第k个卷积核中第s行第t列对应的权值;bk为卷积层中第k个卷积核对应的偏置值。
23、为了提高cnn模型对非线性特征处理能力,通常选择relu函数作为激活函数,表达式为:
24、
25、通过池化层在连续的卷积层中对特征进行筛选和压缩,在保留主要特征的同时降低特征维度,防止过拟合情况,提高模型泛化能力。输出层利用softmax函数回归得到交叉熵损失函数通过计算获取最终分类结果,即配网故障的分类概率,范围在0到1之间,将概率值最大的类别作为样本所属的配网故障类别。
26、softmax函数为:
27、
28、交叉熵损失函数为:
29、
30、式中j表示交叉熵损失函数;xi表示全连接层的输出值;yi表示4种配网故障的真实类别即线路接地故障、外力因素故障、雷击故障、其他故障;h(xi)表示softmax函数回归后的值。
31、本专利技术利用故障数据集d训练2d-cnn神经网络模型,通过模型卷积层提取信息并学习故障特征,采用时间序列的反向传播算法(bptt)进行训练误差反向传播,不断更新模型参数,通过梯度下降法优化损失函数,得到最优配网故障分类预测模型,实现配网故障分析。
32、本专利技术使用测试数据集对模型进行测试,验证模型效果。
33、本专利技术选用roc曲线及混淆矩阵判定模型分类结果。混淆矩阵将分类结果分为以下四类:
34、tp(true positive):将正类预测为正类的个数,表示结果正确;
35、fn(false negative):将正类预测为负类的个数,表示结果错误;
36、fp(false positive):将负类预测为正类的个数,表示结果错误;
37、tn(true negative):将负类预测为负类的个数,表示结果正确。
38、在混淆矩阵的基础上,roc曲线的横坐标代表的是假阳性率(f本文档来自技高网...
【技术保护点】
1.一种基于大数据的配网故障分析方法,其特征在于,包括以下步骤:
2.根据权利要求1中所述的一种基于大数据的配网故障分析方法,其特征在于,步骤一中,利用K-means聚类算法对原始故障数据集D通过聚类得到故障类别:
3.根据权利要求2中所述的一种基于大数据的配网故障分析方法,其特征在于,聚类算法通过CH分数优化故障数据聚类结果,CH分数计算过程如下:
4.根据权利要求1中所述的一种基于大数据的配网故障分析方法,其特征在于,步骤二中,利用信息增益筛选形成新的风险指标,业务系统中存储大量故障相关信息,为降低网络复杂度,提升模型训练速度,通过计算信息增益对变量进行特征选择,当变量的信息增益值越大时,表明变量对分类做出的贡献越多,即变量的重要程度越高;
5.根据权利要求4中所述的一种基于大数据的配网故障分析方法,其特征在于,通过梯度下降算法优化2D-CNN网络构建故障分类模型:
【技术特征摘要】
1.一种基于大数据的配网故障分析方法,其特征在于,包括以下步骤:
2.根据权利要求1中所述的一种基于大数据的配网故障分析方法,其特征在于,步骤一中,利用k-means聚类算法对原始故障数据集d通过聚类得到故障类别:
3.根据权利要求2中所述的一种基于大数据的配网故障分析方法,其特征在于,聚类算法通过ch分数优化故障数据聚类结果,ch分数计算过程如下:
4.根据权利要求1中所述...
【专利技术属性】
技术研发人员:滕爱国,朱佳佳,陆佳鑫,沈力,奚梦婷,查俊杰,李博,刘友春,
申请(专利权)人:国网江苏省电力有限公司信息通信分公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。