本发明专利技术公开了一种数据预测算法选择方法、数据预测方法及数据预测装置,通过获取历史时序数据、判断历史时序数据的数据特征、根据数据特征获得历史时序数据的趋势指数、根据趋势指数和数据特征选择预测算法、根据选择的预测算法进行预测的方式,对各种形态的数据序列进行无参数的趋势判定和预测,通过置信度来衡量预测结果的可靠性,并使用高置信度的长期预测结果,对低置信度的短期预测结果进行校正回归。归。归。
【技术实现步骤摘要】
数据预测算法选择方法、数据预测方法及数据预测装置
[0001]本专利技术涉及人工智能
,尤其涉及一种数据预测算法选择方法、数据预测方法及数据预测装置。
技术介绍
[0002]在IT运维管理过程中,会采集到大量指标数据,如主机CPU、内存使用率等,如果想及时掌控被管理对象的未来状态信息,需要基于已采集的指标信息,进行预测,获取未来若干天的指标的预测值。
[0003]这一过程中涉及到数据预测,但是问题的难点在于如何对各种不同形态的时序数据,选择合理的预测算法,进而得到符合期望的预测结果。现有技术方案中,大多是通过比较不同预测算法预测结果的误差值,来选择最小误差的算法作为目标预测算法。但实际情况是,指标数据的形态在不断变化,大部分的指标数据呈现随机游走的趋势特征,基于算法模型的预测思路,很难满足现实需求。
技术实现思路
[0004]鉴于目前存在的上述不足,本专利技术提供一种数据预测算法选择方法、数据预测方法及数据预测装置,能够对各种形态的数据序列进行无参数的趋势判定和预测。
[0005]为达到上述目的,本专利技术的实施例采用如下技术方案:
[0006]一种数据预测算法选择方法,所述数据预测算法选择方法包括以下步骤:
[0007]获取历史时序数据;
[0008]判断历史时序数据的数据特征;
[0009]根据数据特征获得历史时序数据的趋势指数;
[0010]根据趋势指数和数据特征选择预测算法。
[0011]依照本专利技术的一个方面,所述判断历史时序数据的数据特征包括:进行时序数据曲线特征提取,从多个维度生成曲线的特征指数。
[0012]依照本专利技术的一个方面,所述进行时序数据曲线特征提取,从多个维度生成曲线的特征指数包括:提取数据序列的趋势特征,所述趋势特征可包括有多种类型。
[0013]依照本专利技术的一个方面,所述根据数据特征获得历史时序数据的趋势指数包括:提取了趋势特征后,通过判决树将定性的趋势特征转换为定量的趋势指数,用以定量地衡量数据序列的趋势化程度。
[0014]依照本专利技术的一个方面,所述根据数据特征获得历史时序数据的趋势指数包括:获取各种类型的趋势特征后,结合数据序列的统计特征,来确定各个趋势特征的在趋势判定中的权值,最终求出数据序列的整体趋势指数。
[0015]依照本专利技术的一个方面,所述统计特征包括均值偏倚量、中位数偏倚量和波动占比;每种趋势特征都有对应的权值函数:Weight=F(均值偏倚量)+F(中位数偏倚量)+F(波动占比);数据序列的趋势指数为各趋势特征指数的加权平均。
[0016]依照本专利技术的一个方面,所述根据趋势指数和数据特征选择预测算法包括:根据趋势指数、数据特征,通过预测算法判决器执行,选择合适的预测算法。
[0017]依照本专利技术的一个方面,所述根据趋势指数和数据特征选择预测算法包括:通过数据特征进行判断平稳性判定,若为平稳序列则选择预定预测算法;若为不平稳序列则进行自相关判定,若符合自相关则选择预定预测算法,若不符合则根据趋势指数来选择预定预测算法。
[0018]一种数据预测方法,所述数据预测方法包括以下步骤:
[0019]获取历史时序数据;
[0020]判断历史时序数据的数据特征;
[0021]根据数据特征获得历史时序数据的趋势指数;
[0022]根据趋势指数和数据特征选择预测算法;
[0023]根据选择的预测算法进行预测。
[0024]依照本专利技术的一个方面,所述判断历史时序数据的数据特征包括:进行时序数据曲线特征提取,从多个维度生成曲线的特征指数。
[0025]依照本专利技术的一个方面,所述进行时序数据曲线特征提取,从多个维度生成曲线的特征指数包括:提取数据序列的趋势特征,所述趋势特征可包括有多种类型。
[0026]依照本专利技术的一个方面,所述根据数据特征获得历史时序数据的趋势指数包括:提取了趋势特征后,通过判决树将定性的趋势特征转换为定量的趋势指数,用以定量地衡量数据序列的趋势化程度。
[0027]依照本专利技术的一个方面,所述根据数据特征获得历史时序数据的趋势指数包括:获取各种类型的趋势特征后,结合数据序列的统计特征,来确定各个趋势特征的在趋势判定中的权值,最终求出数据序列的整体趋势指数。
[0028]依照本专利技术的一个方面,所述统计特征包括均值偏倚量、中位数偏倚量和波动占比;每种趋势特征都有对应的权值函数:Weight=F(均值偏倚量)+F(中位数偏倚量)+F(波动占比);数据序列的趋势指数为各趋势特征指数的加权平均。
[0029]依照本专利技术的一个方面,所述根据趋势指数和数据特征选择预测算法包括:根据趋势指数、数据特征,通过预测算法判决器执行,选择合适的预测算法。
[0030]依照本专利技术的一个方面,所述根据选择的预测算法进行预测包括:对同一数据序列,从短、中、长不同的维度分别进行预测,利用中、长期中可信度较高的预测值,对短期预测结果做矫正回归,得到更加合理的预测结果。
[0031]一种数据预测装置,所述装置包括:
[0032]获取单元,用于获取历史时序数据;
[0033]数据特征获取单元,用于判断历史时序数据的数据特征;
[0034]趋势指数判决单元,用于根据数据特征获得历史时序数据的趋势指数;
[0035]预测算法判决单元,用于根据趋势指数和数据特征选择预测算法;
[0036]预测单元,用于根据选择的预测算法进行预测。
[0037]本专利技术实施的优点:本专利技术所述的数据预测算法选择方法、数据预测方法及数据预测装置,通过获取历史时序数据、判断历史时序数据的数据特征、根据数据特征获得历史时序数据的趋势指数、根据趋势指数和数据特征选择预测算法、根据选择的预测算法进行
预测的方式,对各种形态的数据序列进行无参数的趋势判定和预测,通过置信度来衡量预测结果的可靠性,并使用高置信度的长期预测结果,对低置信度的短期预测结果进行校正回归;适用于任意形态、任意数据量(length>=1)的时序数据;预测度数(degree)X是指通过给定的数据序列,获取接下来的X个预测值;比如,原始数据为最近30天的主机CPU使用率,当预测度数为7时,预测算法会返回接下来七天的CPU使用率,作为预测结果;选择合适的预测算法,进行预测,预测结果的可信度会随着预测度数的增大而降低。对同一数据序列,从短(天)、中(周)、长(月)不同的维度分别进行预测,然后,利用中、长期中可信度较高的预测值,对短期预测结果做矫正回归,进而得到更加合理的预测结果。
[0038]IT运维领域的指标数据,如CPU使用率,内存使用率,在瞬时态或较短周期内,往往有较大的波动,呈现出随机性的曲线特征,在管理决策上,没有太大的指导意义和参考价值;本专利技术所述的数据预测方法,是对数据序列的趋势性进行预测,从时序数据的时域、频域、空间域等多个特征维度,发掘曲线形态的趋势特征,进而实施预测,既有效的避免了短期波动的本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种数据预测算法选择方法,其特征在于,所述数据预测算法选择方法包括以下步骤:获取历史时序数据;判断历史时序数据的数据特征;根据数据特征获得历史时序数据的趋势指数;根据趋势指数和数据特征选择预测算法。2.根据权利要求1所述的数据预测算法选择方法,其特征在于,所述判断历史时序数据的数据特征包括:进行时序数据曲线特征提取,从多个维度生成曲线的特征指数。3.根据权利要求2所述数据预测算法选择方法,其特征在于,所述特征指数为用于定量化地衡量曲线在某种特征上显著程度的数值,值域为[0,1]。4.根据权利要求2所述的数据预测算法选择方法,其特征在于,所述进行时序数据曲线特征提取,从多个维度生成曲线的特征指数包括:提取数据序列的趋势特征,所述趋势特征可包括有多种类型。5.根据权利要求4所述的数据预测算法选择方法,其特征在于,所述根据数据特征获得历史时序数据的趋势指数包括:提取了趋势特征后,通过判决树将定性的趋势特征转换为定量的趋势指数,用以定量地衡量数据序列的趋势化程度。6.根据权利要求4所述的数据预测算法选择方法,其特征在于,所述根据数据特征获得历史时序数据的趋势指数包括:获取各种类型的趋势特征后,结合数据序列的统计特征,来确定各个趋势特征的在趋势判定中的权值,最终求出数据序列的整体趋势指数。7.根据权利要求6所述的数据预测算法选择方法,其特征在于,所述统计特征包括均值偏倚量、中位数偏倚量和波动占比;每种趋势特征都有对应的权值函数:Weight=F(均值偏倚量)+F(中位数偏...
【专利技术属性】
技术研发人员:安藤,王俊,郭建徽,徐成全,
申请(专利权)人:上海北塔软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。