融合博弈论的变压器风险致因分析方法技术

技术编号:35499139 阅读:26 留言:0更新日期:2022-11-05 17:03
本发明专利技术涉及一种融合博弈论的变压器风险致因分析方法。包括以下步骤:S1:收集变压器传感器数据,进行kNN缺失值填补;S2:将S1中收集的数据进行3

【技术实现步骤摘要】
融合博弈论的变压器风险致因分析方法


[0001]本专利技术涉及一种变压器风险评估致因分析技术,特别涉及一种结合博弈论与机器学习的反向致因分析方法,具体是利用机器学习模型来得到对变压器的风险状态评估,并且通过博弈论Shapleyvalue理论对机器学习模型再次建模,从而对机器学习模型得到的变压器风险状态评估进行有效的致因分析,属于变压器风险评估


技术介绍

[0002]随着海洋资源的开发和利用,以及海上平台的发展,如何对海上平台上时刻运行的变压器等电气设备进行有效的监测成为了国内外研究关注的重点,变压器不仅关系到海上平台作业的安全运行、同时关系到附近平台群电网的平稳运行。
[0003]由于海上平台距岸距离较远,因此无法进行常规巡检,有必要针对关键变配电设备进行全方位在线监控,实时掌握电气设备的运行状态,并采用科学合理的检修策略,从而保障海上油气平台供电可靠性,近年来,针对电气设备故障问题,各作业区也采用安装变压器在线监测系统等方式来进行辅助维护。
[0004]从国内外发展现状来看,电气设备的在线监测系统的研究较为成熟,并且国内外大多学者都对电气监测系统中的大量数据进行了数理分析及数据挖掘,目前用于数据挖掘的主要手段包括时间序列预测、风险状态评估等,其中风险状态评估以机器学习或深度学习技术为基础,通过机器学习模型或深度神经网络模型来对采集的传感器数据进行非线性拟合,并结合实际人工标注的变压器风险评估标签,可以在大多数场景下实现较高的准确率。这些监测评估方法在取得一定效果的同时,也存在一些问题:1)数据采集后的处理没有标准可循,随着各种监测设备及信息化系统的逐步完善与应用,设备运行状态的相关信息呈现出多源、异构的数据特征,容易造成不同工区系统数据融合度较差的问题;2)这些方法虽然采用了一些大数据人工智能技术来预测、评估变压器的健康状态,但并没有指出设备风险状态的原因,使得类似的变压器状态评估结果只是空中楼阁,缺乏完备的原因分析支撑。
[0005]例如,变压器的风险评估模型提示变压器具有一级风险,急需现场人员维修调试,然而在海上油气作业平台上,排查维修的成本是高昂的,这就要求数据挖掘技术不仅需要给出设备的风险状况评估,还需给出支撑这一评估的致因分析,现场人员通过致因分析结合实际数据,进一步人工监督设备运行,在确定设备的风险状况后排查维修,可以提高电气设备的安全稳定性以及排查维修的成本。

技术实现思路

[0006]为了解决上述提出的问题,本专利技术提出了一种融合博弈论贡献分析的变压器风险致因分析方法,博弈论中的贡献分配问题是一个经典问题,通过分析团队协作中每个成员的参与与否,来公平的衡量成员对团队的贡献,此理论具有完备的数学理论支撑,本专利将此理论融合机器学习模型,将数据的传感器特征视为团队成员,将模型输出视为团队,此时
就可以为机器学习模型进行算法建模,从而依靠博弈论完备的数学理论来对传感器特征的贡献做出公平的评估。
[0007]一种融合博弈论的变压器风险致因分析方法,其特征在于,所述具体步骤如下:S1:定时收集变压器历史传感器数据,在不同传感器采集到的n条数据,按照时间进行对齐,并且进行缺失值填补,本专利采用“kNN缺失值填补方法”,基于欧氏距离的最短距离点被认为是最近邻点,在处理缺失值的时候,找到距离这条数据最近的k个数据点所对应得缺失传感器特征的平均值来进行填补,同时,采集对应变压器风险水平人工标注数据n条,在此步骤中,存储缺失值填补之前的n条数据值;S2:将S1中收集并填补了缺失值的数据进行异常值检测,本专利采用3

sigma异常值检测技术,计算确定上下三个扰动范围的正常区间,超过这个区间的误差不属于随机误差而是粗大误差,含有该误差的数据予以剔除,经过步骤S1和异常值剔除后,可以有效的减少海上平台恶劣环境造成的传感器短暂失去数据传输的影响,在此步骤中,计算并存储剔除异常值之前的数据平均值μ和标准差σ;S3:以步骤S2中各个传感器采集的n条数据为训练数据,以步骤S1中采集的n条变压器风险水平人工标注数据为标签,利用机器学习模型对数据进行拟合训练,为保证模型尽可能地拟合步骤S2中清洗后的数据,本专利采用较为复杂的机器学习模型——随机森林。随机森林模型是一个包含多个决策树的分类器并且其输出的类别是由个别树输出类别的众数而定,在新的输入数据进入时,每一棵决策树会分别进行判断和分类,所有决策树的分类结果中哪一个分类比较多,那么就会采纳为随机森林模型的最终分类结果。随机森林模型采用众多决策树分别训练,可以有效避免复杂机器学习模型导致的过拟合问题,并且可以非常有效的拟合变压器特殊的电气背景数据。随机森林模型的拟合训练过程包含四个步骤:1)随机抽样数据;2)随机选取数据特征;3)重复执行随机选取特征的步骤;4)建立大量的决策树分类器,形成随机森林;S4:利用博弈论Shapleyvalue思想,对步骤S3中拟合训练好的随机森林模型进行数学建模,博弈论的Shapleyvalue思想是以团队和成员为背景,通过分析不同成员的不同排列组合方式下,团队最终的产出结果如何变化,来确定每一名成员对所属团队的贡献值。本专利中我们将步骤S1、S2中采集、处理得到的传感器数据中每一个传感器维度特征作为成员,将人工标注的变压器风险水平数据作为团队产出,构建融合博弈论与机器学习的数学模型;S5:将新时刻不同传感器的数据x采集上来,经过步骤S1的时间对齐和缺失值填补,步骤S1中将使用之前存储的n条未填补数据,并带入步骤S2中进行异常值剔除,步骤S2中将之前n条数据的平均值μ与标准差σ进行迭代更新,并使用新的平均值μ与标准差σ进行异常值剔除;S6:将步骤S5中得到的新数据x输入随机森林模型,即可得到预测的变压器风险状态评估,在此步骤,通过博弈论Shapley value分析来对随机森林模型的输出,即变压器风险状态评估,进行计算、分析和解释,在新数据x上,对于某个传感器特征j,其对于模型预测的贡献记为:
其中,S是当前传感器特征子集,N是传感器特征的所有子集,是排除j在外的所有子集,是对子集S加上传感器特征j后的模型输出值,是仅在子集S上的模型输出值,意为考虑子集S时,有无传感器特征j对模型输出的影响,此步骤得到每一个数据每一个传感器特征的贡献,此向量的维度是(1,d),其中d是传感器特征个数;S7:将步骤S6中得到的贡献向量进行归一化处理,经过归一化处理后,可以将每一个传感器特征的贡献值限制到(0,1)之间,更适合作为致因分析来表征风险原因所在,此时通过判断每一个传感器特征贡献值的大小来判断是变压器的哪一个因素造成了变压器的风险状态;S8:定义变压器风险评估致因分析流水线:循环经过步骤S5得到变压器的风险状态预测、循环经过步骤S6、S7得到对此风险状态预测结果的致因分析,定义此流水线可以在线监控变压器的风险状态,并且实时给出风险状态的原因分析,可以指导工程人员排查检修。
[0008]在步骤S1中,进行数据缺失值填补,采用kNN最近邻缺失值填补方法,对缺失的数据进行补充,由于后续步骤5中会将新数据逐条读取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.融合博弈论的变压器风险致因分析方法,其特征在于,包括以下步骤:S1:定时收集变压器历史传感器数据,在不同传感器采集到的n条数据,按照时间进行对齐,并且进行缺失值填补,采用“kNN缺失值填补方法”;S2:将S1中收集并填补了缺失值的数据进行异常值计算检测,采用3

sigma异常值检测技术,计算确定上下三个扰动范围的正常区间,超过这个区间的误差不属于随机误差而是粗大误差,含有该误差的数据予以剔除;S3:以步骤S2中各个传感器采集的n条数据为训练数据,以步骤S1中采集的n条变压器风险水平人工标注数据为标签,利用机器学习模型对数据进行拟合训练,采用较为复杂的集成树模型——随机森林;S4:利用博弈论Shapley value思想,对步骤S3中拟合训练好的随机森林模型进行数学建模;S5:将新时刻不同传感器的数据x采集上来,经过步骤S1的数据清洗与缺失值填补,此步骤中将使用之前存储的n条未填补数据,并带入步骤S2中进行异常值剔除;S6:将步骤S5中得到的新数据x输入随机森林模型,即可得到预测的变压器风险状态评估,再通过博弈论Shapley value分析来对随机森林模型的输出,即变压器的风险评估等级,进行计算、分析和解释,得到每一个数据每一个传感器维度特征的贡献;S7:将步骤S6中得到的贡献向量进行归一化处理,经过归一化处理后,可以将每一个传感器特征贡献值限制到(0,1)之间,更适合作为致因分析来表征风险原因所在;S8:定义变压器风险评估致因分析流水线:循环经过步骤S5得到变压器的风险状态预测、循环经过步骤S6、S7得到对此风险状态预测结果的致因分析,定义此流水线可以在线监控变压器的风险状态,并且实时给出风险状态的原因分析,可以指...

【专利技术属性】
技术研发人员:汪敏杨春宇张安安李茜杨威张亮邓江湖李自平
申请(专利权)人:西南石油大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1