System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及水电机组状态监测,尤其涉及一种水电机组状态监测数据清洗方法、装置及电子设备。
技术介绍
1、水电机组检修以状态监测为基础,依据监测到的数据进行故障诊断、做出维修决策,因此状态监测数据的全面、有效和可靠,对状态检修的顺利开展至关重要。
2、水电机组结构复杂,是由水力、机械、电气、控制和辅助设备等多方面因素相互耦合形成的一个有机整体,因此各个部分的运行状态和健康状况并非独立无关。现有水电机组状态监测数据清洗,一般通过人工综合多方面的数据,综合判断,辨识错误数据,进行数据清洗,数据清洗之后再进行水电机组状态的分析。例如,基于经验设置状态监测数据的正常范围,超出范围则视为异常数据。然而状态监测是随水电机组的运行持续变化的,仅依靠固定的范围值判断的准确性较低。
技术实现思路
1、本专利技术提供了一种水电机组状态监测数据清洗方法、装置及电子设备,以解决现有数据清洗方式准确性低的问题。
2、第一方面,本专利技术提供了一种水电机组状态监测数据清洗方法,包括:
3、获取历史水电机组状态监测数据,其中,所述水电机组状态监测数据为电气参数时序数据、机械参数时序数据或热量参数时序数据中的任一种。
4、基于预设的距离值,得到领域半径、领域密度阈值。
5、基于领域半径、领域密度阈值,通过预设dbscan聚类模型,对所述历史水电机组状态监测数据进行聚类,得到多个聚类后的数据集。
6、将所述多个聚类后的数据集之外的噪声点数据去除
7、在一种可能的实现方式中,在将所述多个聚类后的数据集之外的噪声点数据去除之后,还包括:
8、将所述水电机组状态监测数据按预设时长划分为多个时序数据集。
9、若任一时序数据集中噪声点数据的比例超过预设值,则将该时序数据集中所有数据去除。
10、在一种可能的实现方式中,在将所述水电机组状态监测数据按预设时长划分为多个时序数据集之后,还包括:
11、若任一时序数据集中时间连续的噪声点数据的时长超过预设值,则将该时序数据集中所有数据去除。
12、在一种可能的实现方式中,在所述得到清洗后的水电机组状态监测数据之后,还包括:
13、将清洗后的水电机组状态监测数据,转换为多维子时间序列数据。
14、基于多维子时间序列数据,得到矩阵数据。
15、基于时序数据连续性,通过预设lstm神经网络模型,对所述矩阵数据进行缺失值填充,得到恢复后的水电机组状态监测数据。
16、在一种可能的实现方式中,在得到恢复后的水电机组状态监测数据之后,还包括:
17、基于均方误差、均方根百分比误差、平均绝对百分比误差和拟合优度评价所述lstm神经网络,确定恢复后的水电机组状态监测数据的准确性。
18、在一种可能的实现方式中,基于以下公式,计算所述均方误差、均方根百分比误差、平均绝对百分比误差和拟合优度:
19、
20、
21、
22、
23、其中,mse表示均方误差、rmspe表示均方根百分比误差、mape表示平均绝对百分比误差,t2表示拟合优度,n为样本个数。yt为时刻的实际值。yt为模型在t时刻的预测值。y为实际值的平均值。
24、第二方面,本专利技术提供了一种水电机组状态监测数据清洗装置,包括:
25、获取模块,用于获取历史水电机组状态监测数据,其中,所述水电机组状态监测数据为电气参数时序数据、机械参数时序数据或热量参数时序数据中的任一种。
26、参数确定模块,用于基于预设的距离值,得到领域半径、领域密度阈值。
27、聚类模块,用于基于领域半径、领域密度阈值,通过预设dbscan聚类模型,对所述历史水电机组状态监测数据进行聚类,得到多个聚类后的数据集。
28、去除模块,用于将所述多个聚类后的数据集之外的噪声点数据去除,得到清洗后的水电机组状态监测数据。
29、在一种可能的实现方式中,在将所述多个聚类后的数据集之外的噪声点数据去除之后,还包括:
30、将所述水电机组状态监测数据按预设时长划分为多个时序数据集。
31、若任一时序数据集中噪声点数据的比例超过预设值,则将该时序数据集中所有数据去除。
32、第三方面,本专利技术提供了一种电子设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
33、第四方面,本专利技术提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上第一方面或第一方面的任一种可能的实现方式所述方法的步骤。
34、本专利技术提供一种水电机组状态监测数据清洗方法、装置及电子设备,该方法包括:获取历史水电机组状态监测数据,其中,水电机组状态监测数据为电气参数时序数据、机械参数时序数据或热量参数时序数据中的任一种。基于预设的距离值,得到领域半径、领域密度阈值。基于领域半径、领域密度阈值,通过预设dbscan聚类模型,对历史水电机组状态监测数据进行聚类,得到多个聚类后的数据集。将多个聚类后的数据集之外的噪声点数据去除,得到清洗后的水电机组状态监测数据。本专利技术基于水电机组监测数据的时序连续性,通过dbscan聚类模型确定聚类之外的噪声点数据,去除噪声点数据,得到清洗后的水电机组状态监测数据。噪声点数据基于实时变化的时序数据中相近数据点确定,考虑了水电机组状态的持续变化特性,提升了水电机组监测数据清洗的准确性。
本文档来自技高网...【技术保护点】
1.一种水电机组状态监测数据清洗方法,其特征在于,包括:
2.根据权利要求1所述的水电机组状态监测数据清洗方法,其特征在于,在将所述多个聚类后的数据集之外的噪声点数据去除之后,还包括:
3.根据权利要求2所述的水电机组状态监测数据清洗方法,其特征在于,在将所述水电机组状态监测数据按预设时长划分为多个时序数据集之后,还包括:
4.根据权利要求1所述的水电机组状态监测数据清洗方法,其特征在于,在所述得到清洗后的水电机组状态监测数据之后,还包括:
5.根据权利要求4所述的水电机组状态监测数据清洗方法,其特征在于,在得到恢复后的水电机组状态监测数据之后,还包括:
6.根据权利要求5所述的水电机组状态监测数据清洗方法,其特征在于,基于以下公式,计算所述均方误差、均方根百分比误差、平均绝对百分比误差和拟合优度:
7.一种水电机组状态监测数据清洗装置,其特征在于,包括:
8.根据权利要求7所述的水电机组状态监测数据清洗装置,其特征在于,在将所述多个聚类后的数据集之外的噪声点数据去除之后,还包括:
9
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上的权利要求1至6中任一项所述水电机组状态监测数据清洗方法的步骤。
...【技术特征摘要】
1.一种水电机组状态监测数据清洗方法,其特征在于,包括:
2.根据权利要求1所述的水电机组状态监测数据清洗方法,其特征在于,在将所述多个聚类后的数据集之外的噪声点数据去除之后,还包括:
3.根据权利要求2所述的水电机组状态监测数据清洗方法,其特征在于,在将所述水电机组状态监测数据按预设时长划分为多个时序数据集之后,还包括:
4.根据权利要求1所述的水电机组状态监测数据清洗方法,其特征在于,在所述得到清洗后的水电机组状态监测数据之后,还包括:
5.根据权利要求4所述的水电机组状态监测数据清洗方法,其特征在于,在得到恢复后的水电机组状态监测数据之后,还包括:
6.根据权利要求5所述的水电机组状态监测数据清洗方法,其特征在于,基于以下公...
【专利技术属性】
技术研发人员:赖昕杰,熊梦思,宗悦,苏展,杨子越,刘忠伟,董焕然,王永利,
申请(专利权)人:中国电建集团华东勘测设计研究院有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。