System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及电力系统中高压电器设备的检测,具体涉及一种基于数据生成-迁移学习的变压器故障诊断方法。
技术介绍
1、电力变压器是电力系统中最为核心的设备之一,其安全稳定运行对于电力系统具有重要意义。目前,电力变压器中的绝大部分为油浸式变压器,对油浸式变压器的状态进行监测极为重要。在油浸式变压器状态监测中,油中溶解气体分析(dga)是最为重要的检测方法之一,其的优点在于dga不受变压器中电场和磁场的影响,能够在变压器不停运时带电检测。绝缘油中油中溶解气体的含量与电力变压器的运行状态有着紧密联系,可以反映其内部多种故障状态,基于气体含量数据的变压器故障诊断方法可实现电力变压器早期故障的诊断,在电力变压器运行过程中实时进行故障分析。
2、dga故障诊断的传统故障诊断方法主要包括ieee/iec标准、rogers比值法、duval三比值法、duval五边形法等。这些传统方法仅依据判别准则来进行诊断、对于数据量无要求,但它们无任何学习能力、阈值边界过于绝对,故障诊断的精度较低。dga故障诊断的机器学习方法主要包括支持向量机、贝叶斯网络、多层感知机及轻梯度提升机等。这些机器学习方法的模型参数量较小、适合数据量较小的诊断判别,但它们难以挖掘出数据深层的特征,故障诊断的精度也有限。
3、近年来,深度学习技术广泛应用于自然语言处理、计算机视觉等多个领域,对各领域产生了巨大的提升,这为实现变压器高精度故障诊断带来了机遇。然而,深度学习的训练需要大量数据,由于电力变压器的异常发生为小概率事件,且各类异常发生比例差距很大,因此变
4、要解决由于样本数量过少引起的模型准确率低的问题,则必须研究有效扩展dga数据样本的方法。然而,dga数据属于表格数据,在表格数据领域,常见的数据增强方法仍是少数类过采样等方法,泛化性有限,虽然近年来涌现了一批可用于表格数据合成的生成对抗网络(generative adversarial network,gan),例如ctgan网络等,但是研究才刚起步,合成的表格数据质量有待提高。
5、通过分析各故障类型dga数据的特征,发现对dga数据取对数log(·)后,其两两气体之间的分布特征有明显的椭圆形分布规律,这种分布规律符合近似的高斯分布,而多元分布建模中的copula函数可以用于研究多维随机变量的联合分布,因此可以用来对dga数据进行建模,可以通过对建模后的分布模型进行采样得到任意多的dga合成数据。
6、当特定于任务的真实训练数据稀缺时,迁移学习是必不可少的,迁移学习被广泛应用于计算机视觉和自然语言处理等领域,而预训练-微调是一种被长期检验、行之有效的迁移学习方法。因此,有必要研究基于dga数据的预训练-微调方法。先使用dga合成数据集的预训练方法,使深度学习模型能学习到合成数据的特征,再使用dga真实数据集对模型微调,达到知识迁移的目的。
7、ft-transformer是一种专为表格数据设计的一种transformer网络,可以通过注意力机制捕捉到表格数据多变量间的相关性,在表格数据分类任务达到其他类型的深度模型未能达到的优良效果,因此适合用于dga数据的变压器故障诊断。
技术实现思路
1、鉴于变压器dga真实故障数据匮乏,样本类别不均衡的现状,本公开通过copula函数对各类别对数气体含量数据进行多维分布建模,对模型采样得到大量dga合成数据,通过预训练-微调ft-transformer模型:利用dga合成数据预训练,使用dga真实数据的训练集微调。提升dga真实数据测试集故障诊断准确率。最终该模型可用于对变压器中实时dga数据进行监测及故障诊断,实现电力变压器状态监测和高精度故障诊断。
2、为实现上述目的,本专利技术采用如下技术方案:
3、(1)从数据库中读取变压器dga原始有标签数据集,该dga真实数据集中包含各气体含量数据及故障类别标签;
4、(2)对所述dga真实数据集进行数据清洗,将0替换为一个极小值,例如10-2,避免后续对数变换后出现nan值;
5、(3)对整理后的dga真实数据集中的气体含量列取以某数为底的对数变换log(·),例如自然对数变换ln(·),使得气体含量列的分布近似正态分布;
6、(4)根据dga真实数据集所属的类别(局部放电、低能放电、高能放电、低温过热、中温过热、高温过热和正常),按比例分割成训练集和测试集,例如训练集train:测试集test=8:2,其中训练集和测试集中各类别的比例一致;
7、(5)对每种标签类别(局部放电、低能放电、高能放电、低温过热、中温过热、高温过热和正常)的dga训练集数据分别使用高斯copula函数进行多变量分布建模;
8、(6)对每种类别的高斯copula模型,采样生成同等数量的dga合成数据,例如各类别都采样10000个样本点,加入标签列,将各标签类别的合成数据组成成一个dga合成数据集,该合成数据集为各类别样本数均等的数据集;
9、(7)对dga真实数据集的训练集进行标准化,对dga合成数据集使用训练集的标准化参数进行标准化;
10、(8)使用标准化后的dga合成数据集对ft-transformer模型进行预训练;
11、(9)使用标准化后的dga真实数据集的训练集对预训练好的ft-transformer模型进行微调;
12、(10)对dga真实数据集的测试集使用训练集标准化参数进行标准化;
13、(11)使用标准化后dga真实数据集的测试集对ft-transformer模型进行测试;
14、(12)测试合格后,可应用于真实变压器实时dga数据的监测和故障诊断。
15、基于数据生成-迁移学习的变压器故障诊断方法,包括以下步骤:
16、步骤s1,获取数据库中存储的油中溶解气体分析有标签数据,所述有标签数据包含各气体含量数据及故障类别标签;
17、步骤s2,将气体含量数据对数变换处理成近似正态分布的形态;
18、步骤s3,对步骤s2处理后的数据构建高维分布,使用copula函数可以提取高维分布的统计信息,进而根据这些信息采样出油中溶解气体分析合成数据样本;
19、步骤s4,生成油中溶解气体分析合成数据后,可以使用ft-transformer模型进行预训练-微调,并进行故障诊断。
20、本技术方案进一步的优化,所述气体种类包括氢气、甲烷、乙烷、乙烯、乙炔。
21、本技术方案进一步的优化,所述故障类别包括局部放电pd、低能放电d1、高能放电d2、低温过热t1、中温过热t2、高温过热t3及正常状态normal。
22、本技术方本文档来自技高网...
【技术保护点】
1.基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述气体种类包括氢气、甲烷、乙烷、乙烯、乙炔。
3.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述故障类别包括局部放电PD、低能放电D1、高能放电D2、低温过热T1、中温过热T2、高温过热T3及正常状态Normal。
4.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述步骤S1还包括对所述油中溶解气体分析真实数据集进行数据清洗,将0替换为一个极小值。
5.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述步骤S3中合成数据的步骤如下:
6.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述步骤S4生成油中溶解气体分析合成数据后,需要对数据进行标准化处理。
7.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述FT-
...【技术特征摘要】
1.基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,包括以下步骤:
2.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述气体种类包括氢气、甲烷、乙烷、乙烯、乙炔。
3.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,所述故障类别包括局部放电pd、低能放电d1、高能放电d2、低温过热t1、中温过热t2、高温过热t3及正常状态normal。
4.如权利要求1所述的基于数据生成-迁移学习的变压器故障诊断方法,其特征在于,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。