System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据预处理,特别是一种调压站采集数据的预处理方法。
技术介绍
1、由于燃气管网老化、城市建设对燃气管网的破坏、设备使用不当等原因,导致经常发生燃气安全事故,对燃气公司的经济效益造成很大不利影响。因此对调压站的运行状态进行故障诊断就显得尤为重要。
2、故障诊断工作的核心是故障预测模型的建立。故障预测模型的预测效果不仅仅依赖于模型本身对现实世界的逼近程度,还十分依赖于无异常、准确、完整的数据。通常在各种数据挖掘和数据预测的过程中,数据预处理要占到60%以上的工作量。在故障诊断系统中,各种的监测数据由固定在调压站的传感器获得,当出现暂时性的仪器监测故障或者网络故障时,会导致上传数据异常或者数据缺失;当环境发生变化时,数据会包含许多非期望的噪声。因此,数据预处理成为了不可或缺的数据处理步骤。
3、当前常用的数据预处理的主要方法有数据清理、数据集成、数据变换和数据归约。选用何种方法没有统一的标准,只能根据不同类型的分析数据和业务需求,在对数据特性做了充分的理解之后,再选择与其最适配的数据预处理技术。在故障诊断的相关文献中,一般会采用如下方法进行数据预处理:
4、(1)对从传感器中读取的原始数据,直接进行归一化处理,在某种程度上直接归一化并未减轻数据异常值的干扰;
5、(2)使用平均值的方法对缺失值进行简单的插补,如果缺失数据过多,则会降低变量之间的相关关系;
6、(3)数据清理,主要是消除数据集中的孤立点,采用平滑来降低数据噪声。
7、总的来说,这些方法
技术实现思路
1、专利技术目的:本专利技术的目的是提供一种调压站采集数据的预处理方法,从而以更快的速度从姿态传感器中读取相关姿态数据,提高预测的效率。
2、技术方案:本专利技术所述的一种调压站采集数据的预处理方法,包括以下步骤:
3、步骤1、上位机通过压强、流量、温度及其他传感器实时采集多个时刻的调压站数据,以构建调压站数据序列;
4、所述的调压站数据序列为:
5、dataa(k)(m)=(a(1),a(2),...,a(n))
6、其中,dataa(k)(m)表示k号调压站编号为m的压强传感器产生的数据序列,a(t)表示调压站数据序列中第t个时刻的压强数据,t∈[1,n],n表示采集时刻的数量;
7、datab(k)(m)=(b(1),b(2),...,b(n))
8、其中,datab(k)(m)表示k号调压站编号为m的流量传感器产生的数据序列,b(t)表示调压站流量数据序列中第t个时刻的流量数据,t∈[1,n],n表示采集时刻的数量;
9、datac(k)(m)=(c(1),c(2),...,c(n))
10、其中,datac(k)(m)表示k号调压站编号为m的温度传感器产生的数据序列,c(t)表示调压站温度数据序列中第t个时刻的温度数据,t∈[1,n],n表示采集时刻的数量;
11、datas(k)=(dataa(k)(1)-1,...,dataa(k)(m1)-1,datab(k)(1)-1,...,datab(k)(m2)-1datac(k)(1)-1,...,datac(k)(m3)-1)
12、其中,datas(k)表示k号调压站数据序列,m1表示k站点压强传感器的数量,m2表示k站点流量传感器的数量,m3表示k站点温度传感器的数量。
13、步骤2、使用期望最大化算法来拟合高斯混合模型;得到每个样本高斯分布的均值、协方差矩阵;对于每个数据点,计算每个样本高斯分布的概率;选择一个合适的阈值,将概率低于该阈值的数据点标记为异常值;
14、所述样本高斯分布的均值为:
15、
16、其中,datas(k)(i)表示k号站点第i个时刻的数据序列,n表示采集时刻的数量;
17、所述样本高斯分布的协方差矩阵为:
18、
19、其中,datas(k)(i)表示k号站点第i个时刻的数据序列,n表示采集时刻的数量datas(k)为k站点数据序列的对应矩阵;
20、所述样本高斯分布的概率为:
21、
22、其中,x表示对应数据点,|x|表示协方差矩阵的行列式,x-1表示矩阵的逆;
23、所述标记异常为:
24、当p(x)小于设置的阈值时,对应的数据点即为异常值。
25、步骤3、根据多地部署的同类型传感器数据序列,对传感器进行相似度计算;
26、所述同类型传感器数据序列为:
27、datasenp=(dataa(1)(1)-1,...,dataa(1)(m1)-1,...,dataa(k)(1)-1,...,dataa(k)(m2)-1)
28、其中,datasenp表示压强传感器数据序列,dataa(k)(m2)-1表示k号站点中编号为m2的压强传感器产生的数据序列,k表示站点的数量,m2表示k站点压强传感器的数量。
29、所述的相似度计算的公式为:
30、
31、将一个传感器si构建一个局部数据矩阵vik,包含时间序列间的读数,其中ω是窗口大小,nt两个传感器都有读数的时间戳的数量;两个传感器(si,s2)之间的相似性是根据局部数据矩阵中的读数来测量的。
32、步骤4、根据相似值计算出异常值对应的空间值;
33、所述空间值的计算公式为:
34、
35、其中m代表传感器的个数,vi代表对应传感器对应时刻的值,simi代表对应传感器的相似值。
36、步骤5、根据本地的多个传感器的数据构建多维矩阵,并利用k近邻算法计算出异常值对应的本地值;
37、所述本地值的计算公式为:
38、
39、其中m代表传感器的个数,vi代表对应传感器对应时刻的值,simi代表对应传感器的相似值。
40、步骤6、将本地值与空间值进行数据融合成一个新值,并替换原来的异常值,得到数据更新后调压站数据序列;
41、步骤6所述的将本地值与空间值进行数据融合成一个新值的计算公式为:
42、v=ω1*vs+ω2*vl+b
43、其中,b是一个偏置数,ωi是每个视图的对应权重。
44、步骤7、对数据更新后调压站数据序列通过鲁棒缩放法进行标准化处理,得到标准化处理后调压站数据序列。
45、所述标准化处理的方法为:
46、首先将数据集进行排序,找到排序后数据集的中间值,即中位数xm;如果数据集包含偶数个数据点,中位数是中间两个数据点的平均值;再计算第一四分位数q1和第本文档来自技高网...
【技术保护点】
1.一种调压站采集数据的预处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤1所述的调压站数据序列为:
3.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤2所述样本高斯分布的均值为:
4.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤3所述同类型传感器数据序列为:
5.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤3所述的相似度计算的公式为:
6.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤4所述空间值的计算公式为:
7.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤5所述本地值的计算公式为:
8.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤6所述的将本地值与空间值进行数据融合成一个新值的计算公式为:
9.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤7所述标准化处理的方
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1-9中任一项所述的一种调压站采集数据的预处理方法。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1-9中任一项所述的一种调压站采集数据的预处理方法。
...【技术特征摘要】
1.一种调压站采集数据的预处理方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤1所述的调压站数据序列为:
3.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤2所述样本高斯分布的均值为:
4.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤3所述同类型传感器数据序列为:
5.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤3所述的相似度计算的公式为:
6.根据权利要求1所述的一种调压站采集数据的预处理方法,其特征在于,步骤4所述空间值的计算公式为:
7.根据权利要求1所述的一种调压站采集数据的...
【专利技术属性】
技术研发人员:接浩,张鸣,刘庆华,赵卫国,张芷若,刘保祥,
申请(专利权)人:江苏科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。