一种数据中心设备运行数据双尺度预测方法技术

技术编号:37470279 阅读:10 留言:0更新日期:2023-05-06 09:50
本申请涉及一种数据中心设备运行数据双尺度预测方法,包括如下步骤:设读入数据中心设备运行所产生的时间序列数据;得到大尺度波动序列和小尺度波动序列;在大尺度波动序列中,为了降低计算复杂度,预测设备状态长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并形成各个时段即大尺度设备运行状态序列,预测大尺度设备运行状态序列以时段为尺度;使用滑动窗口k近邻预测方法和预匹配方式进行大尺度预测;使用AR预测模型进行小尺度预测;基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。本申请降低计算复杂度,预测设备状态长期变化趋势,实现在保持预测性能的同时降低预测算法的开销。测性能的同时降低预测算法的开销。测性能的同时降低预测算法的开销。

【技术实现步骤摘要】
一种数据中心设备运行数据双尺度预测方法


[0001]本申请涉及数据预测领域,涉及一种数据中心设备运行数据双尺度预测方法。

技术介绍

[0002]由于计算机技术、物联网技术和人工智能的迅猛发展,每天都会产生大量的信息数据,这些数据都需要由数据中心中的设备进行处理。对设备的运行数据进行精准预测有助于分析设备的未来工作状态,从而保障数据中心业务的稳定运行。
[0003]为保障数据中心各设备的稳定运行,需要对设备的运行数据进行预测,然而实现这一目标面临如下挑战:第一,基于设备运行数据的突变性,单一时刻的数据突变并不能作为有效参考,因此需要预测较长时间的数据变化,但如何从设备运行数据中提取出长期变化是一个问题。第二,预测长期的数据变化会增加预测误差,而小尺度波动序列反映了数据高频的复杂波动,能够提高短期数据预测的准确度,因此在大尺度预测之后,将预测小尺度波动序列,并将两者结合形成对设备运行数据的预测结果。

技术实现思路

[0004]本申请实施例的目的在于提供一种数据中心设备运行数据双尺度预测方法,降低计算复杂度,预测设备状态长期变化趋势,实现在保持预测性能的同时降低预测算法的开销。
[0005]为实现上述目的,本申请提供如下技术方案:
[0006]本申请实施例提供一种数据中心设备运行数据双尺度预测方法,包括如下步骤:
[0007]步骤1:设备的运行数据在一段时间T内为一个时间序列,读入数据中心设备运行所产生的时间序列数据,记为h(t);
[0008]步骤2:依据经验模态分解,设计一种不完全分解策略,得到最优的分解次数,进而得到大尺度波动序列和小尺度波动序列;
[0009]步骤3:在大尺度波动序列中,为了降低计算复杂度,预测设备状态长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并形成各个时段即大尺度设备运行状态序列,预测大尺度设备运行状态序列以时段为尺度;
[0010]步骤4:使用滑动窗口k近邻预测方法和预匹配方式进行大尺度预测;
[0011]步骤5:使用AR预测模型进行小尺度预测;
[0012]步骤6:基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。
[0013]所述步骤2中为了获得设备运行数据的大尺度波动序列和小尺度波动序列,设计了一种不完全分解策略:
[0014]对于设备运行数据h(t),进行经验模态分解为:
[0015][0016]其中,N
e
是分解次数,y
i
(t)是第i次分解得到的固有模态函数,r(t)是残余序列,
[0017]每个子序列仅反映特定时间尺度变化,并且对所有子序列预测会导致计算复杂度过大,为了获得大尺度和小尺度的设备运行数据变化,将子序列合并成两部分,
[0018]第a次分解后剩余的低频序列为:
[0019][0020]z
a
(t)既需要反应大尺度变化、有一定的平滑性,又与原序列相似,因此构建目标函数:
[0021]argmaxα
a
[0022]α
a
=S
a
(f
m
)*R(z
a
(t),h(t))
[0023]其中,R(z
a
(t),h(t))是z
a
(t)与原序列h(t)的皮尔逊相关系数,反映z
a
(t)与原序列的相似性,S
a
(f
m
)表示将z
a
(t)的频谱等分后,低频部分能量所占的比例,反应序列z
a
(t)的平滑性。找到使α
a
最大的分解次数a
m
作为不完全分解次数,
[0024]皮尔逊相关系数R(z
a
(t),h(t)):
[0025][0026]其中,是z
a
(t)的平均值,是h(t)的平均值。
[0027]S
a
(f
m
)计算如下:
[0028][0029][0030]选取第a
m
次分解后剩余的低频序列作为大尺度波动序列:
[0031][0032]小尺度波动序列:
[0033][0034]所述步骤3中为了降低计算复杂度,预测设备运行数据长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并的方法:
[0035]大尺度波动序列经过时隙τ的平均运行数据变化为:
[0036][0037]其中,S
s
是取样数目。
[0038]计算平均运行数据变化小于阈值D
t
所需的时隙数目为N
large
,将其作为大尺度时段的长度。N
large
满足:
[0039][0040]大尺度设备运行状态序列
[0041]所述步骤4中基于滑动窗口k近邻和预匹配机制的大尺度预测方法为:
[0042]存储的大尺度设备运行状态历史序列为:
[0043]其中u代表当前时间为第u个大尺度时间段,表示第i时段中大尺度设备运行状态。
[0044]训练向量及其标签为:
[0045][0046]其中,n表示滑动窗口的长度,通过此滑动窗口对H
L
进行截取获得训练向量。经过截取后,得到训练集Y=[S
n
,S
n+1
,

,S
u

v
][0047]测试向量为:
[0048]先进行预匹配筛除与测试向量差距较大的训练向量:
[0049]求得训练向量和测试向量第n个元素的差距,若差距大于阈值D
h
,则过滤掉此训练向量。
[0050][0051]计算预匹配后剩余的训练向量S
i
和S
u
间的距离:
[0052][0053]从其中选择k个最近邻训练向量[c1,c2,

,c
k
],其标签对所选择的训练向量c
j
,权重计算为:
[0054][0055]其中,为训练向量和测试向量的距离,表示为:
[0056]最后,大尺度预测值为:
[0057][0058]所述步骤5中基于AR预测模型的小尺度预测方法为:
[0059]小尺度波动序列的预测采用AR模型:
[0060][0061]其中,表示t+1时刻的预测结果,h
re
(t)表示t时刻小尺度波动序列的值,L
AR
表示预测模型的阶数,a
i
表示AR预测模型的第i个系数,b
t+1
表示噪声项。
[0062]与现有技术相比,本专利技术的有益效果是:
[0063]经验模态分解能够将序列分解成反映不同时间尺度波动特征的固有模态函数和剩余项,然而每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据中心设备运行数据双尺度预测方法,其特征在于,包括如下步骤:步骤1:设备的运行数据在一段时间T内为一个时间序列,读入数据中心设备运行所产生的时间序列数据,记为h(t);步骤2:依据经验模态分解,设计一种不完全分解策略,得到最优的分解次数,进而得到大尺度波动序列和小尺度波动序列;步骤3:在大尺度波动序列中,为了降低计算复杂度,预测设备状态长期变化趋势,将大尺度波动序列中的各个时刻数据进行合并形成各个时段即大尺度设备运行状态序列,预测大尺度设备运行状态序列以时段为尺度;步骤4:使用滑动窗口k近邻预测方法和预匹配方式进行大尺度预测;步骤5:使用AR预测模型进行小尺度预测;步骤6:基于大尺度预测值和小尺度预测值得到下一个时刻的设备运行数据。2.根据权利要求1所述的一种数据中心设备运行数据双尺度预测方法,其特征在于,所述步骤2中为了获得设备运行数据的大尺度波动序列和小尺度波动序列,设计了一种不完全分解策略:对于设备运行数据h(t),进行经验模态分解为:其中,N
e
是分解次数,y
i
(t)是第i次分解得到的固有模态函数,r(t)是残余序列,每个子序列仅反映特定时间尺度变化,并且对所有子序列预测会导致计算复杂度过大,为了获得大尺度和小尺度的设备运行数据变化,将子序列合并成两部分,第a次分解后剩余的低频序列为:z
a
(t)既需要反应大尺度变化、有一定的平滑性,又与原序列相似,因此构建目标函数:argmaxα
a
α
a
=S
a
(f
m
)*R(z
a
(t),h(t))其中,R(z
a
(t),h(t))是z
a
(t)与原序列h(t)的皮尔逊相关系数,反映z
a
(t)与原序列的相似性,S
a
(f
m
)表示将z
a
(t)的频谱等分后,低频部分能量所占的比例,反应序列z
a
(t)的平滑性。找到使α
a
最大的分解次数a
m
作为不完全分解次数,皮尔逊相关系数R(z
a
(t),h(t)):其中,是z
a
(t)的平均值,是h(t)的平均值。S
a
(f
m
)计算如下:
选取第a
m
次分...

【专利技术属性】
技术研发人员:庄严董亮郭岳朱兆宇李德识胡耀东柯旺松李想梁源黄超周正廖荣涛袁慧贺亮冯伟东王婕王逸兮罗弦姚渭菁胡欢君李磊邱爽朱国威代荡荡詹伟周蕾
申请(专利权)人:武汉大学国网湖北送变电工程有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1