本发明专利技术提供一种对机群运行状况进行预测的方法和机群平台管理装置,在第一时刻时,采集机群的工作参数,该工作参数用以描述机群的运行状况;根据预先设定的误差分布规律获取误差率矫正项,所述误差率矫正项用以描述所述工作参数在第二时刻时的第一预测值与精确值之间的误差;根据预定方式采用所述工作参数计算出第二时刻时的所述第一预测值;计算出第一时刻的权重系数;根据所述第一预测值、权重系数以及所述误差率矫正项计算出第二时刻时的第二预测值。应用上述技术,算法简单,增加了误差率矫正项体现导致第一预测值出现误差的不确定因素,可以应对各种类型的机群平台带来的误差影响。
【技术实现步骤摘要】
本专利技术 涉及机群管理技术,特别是指一种对机群运行状况进行预测的方法和机群平台管理装置。
技术介绍
在大规模的机群上,由于其资源有限导致资源抢占的情况十分常见,为了公平有 效地利用机群资源,需要在机群上部署必要的管理机制,例如,通过监控功能查看机群资源 的利用情况及硬件信息,例如机群中各个节点计算机的CPU荷载,内存使用,机柜温度,风 扇转速等。由于机群运行状况的变化及不确定性,因此对机群资源进行有效预测可以及时 有效地应对机群资源占用状态的变化,达到预测预警的目的。但是现有的管理技术仅能够 对机群当前运行状况进行监控,提供实时的数据,并没有对未来的运行状况进行预测。实践 证明准确的预报功能对于大规模机群尤为重要,许多机群均经历过由于节点负载过大而导 致机柜温度过高,空调失效等一系列故障,最终不得不采取强制冷关机的办法以免造成硬 件大规模毁坏。虽然硬件得以保全,但是造成了在其上运行的作业被迫中断,数据丢失。现有技术中,大多采用基于趋势分析(Homeostatic and Tendency-Based)的CPU 荷载单步预测方法,该方法是一种简化的时间序列预测模型。专利技术人在实现本专利技术的过程中,发现现有技术中至少存在如下问题现有预测模 型不是基于传统的经典时间预测模型,其运用的广泛度及预测结果的总体准确度无法衡 量,过多依赖于趋势因素而忽视了随机性;且过于简单,在任何平台,如PC、机群以及网格 上都采用同样的预测方法,忽视了各种平台的硬件环境及应用模式之间的不同;例如规模 庞大的机群对某些硬件进行周期性的维护而采取关闭措施十分常见,应用模式也会随时间 的变化而变化,而现有技术没有考虑到这些差异。
技术实现思路
本专利技术的目的是提供一种对机群运行状况进行预测的方法和机群平台管理装置, 对机群的运行状况进行准确的预测,解决现有技术中,难以根据实时采集到的工作参数对 机群的运行状况进行准确的预测的缺陷。一种对机群运行状况进行预测的方法,包括在第一时刻T = t时,采集机群的工 作参数Vt,该工作参数用以描述机群的运行状况;根据预先设定的误差分布规律获取第一 时刻的误差率矫正项Et,所述误差率矫正项用以描述所述工作参数在第二时刻时的第一 预测值 +1与精确值之间的误差;根据预定方式采用所述工作参数Vt计算出第二时刻时的 所述第一预测值;计算出第一时刻的权重系数Wt ;根据所述第一预测值、权重系数以及所述误差率矫正项Et计算出第二时刻时的第二预测值.其中权利要求1.一种对机群运行状况进行预测的方法,其特征在于,包括在第一时刻T = t时,采集机群的工作参数vt,该工作参数用以描述机群的运行状况; 根据预先设定的误差分布规律获取第一时刻的误差率矫正项Et,所述误差率矫正项用 以描述所述工作参数在第二时刻时的第一预测值 +1与精确值之间的误差; 根据预定方式采用所述工作参数Vt计算出第二时刻时的所述第一预测值; 计算出第一时刻的权重系数Wt ;根据所述第一预测值、所述权重系数以及所述误差率Λ矫正项Et计算出第二时刻时的第二预测值&+1 .其中,所述第一预测值、所述权重系数以及)所述误差率矫正项Et满足根据第一时刻的所述权重系数Wt和所述误差率矫正项Et计算出第一时刻的中间值,该 第一时刻的中间值与所述第一预测值的乘积作为所述第二预测值;且根据所述第二预测值与所述第一预测值 +1的比较结果,修改所述中间值。2.根据权利要求1所述的方法,其特征在于,根据第一时刻的所述权重系数Wt和所述 误差率矫正项Et计算出第一时刻的中间值,包括以所述权重系数Wt对所述误差率矫正项Et进行修正;所述权重系数Wt与第一时刻的前一时刻的权重系数Ww相比增加时,第一时刻的所述 中间值相较于所述前一时刻的中间值减少; 修改所述中间值包括当所述第二预测值比所述第一预测值 +1精确时,修改第二时刻的权重系数Wt+1, 权重系数Wt+1增加;当所述第二预测值不比所述第一预测值 +1精确时,修改第二时刻的权重系数Wt+1,权重系数Wt+1减少;以所述权重系数Wt+1与第二时刻的误差率矫正项计算出第二时刻的中间值。3.根据权利要求1所述的方法,其特征在于,根据预先设定的误差分布规律获取误差 率矫正项Et,包括根据Et f(y 二 σ 9计算所述误差率矫正项Et;其中,f表示误差分布规律,表 示对应的分布参数平均值,σ ^表示对应的分布参数方差。4.根据权利要求1所述的方法,其特征在于,根据预定方式计算出第二时刻时的所述 第一预测值包括如果第一时刻T = t时的实际测量值Vt小于前一时刻T = t-Ι时的实际测量值Vw, 则判定趋势为下降,第二时刻T = t+Ι时的第一预测值 +1满足以所述实际测量值Vt减 去一个降值 DecrementValue ;如果第一时刻T = t时的实际测量值Vt大于前一时刻T = t-i时的实际测量值vt_i, 则判定趋势为上升;则,第二时刻T = t+Ι时的第一预测值 +1满足以所述实际测量值Vt 力口上一个升值 IncrementValue ;所述降值DecrementValue禾口升值IncrementValue预先设定。5.根据权利要求2所述的方法,其特征在于,计算出第一时刻T= t的权重系数Wt,包括6.根据权利要求5所述的方法,其特征在于,根据所述第一预测值 +1、权重系数Wt以及所述误差率矫正项Et计算出第二时刻时的第二预测值,包括7.根据权利要求6所述的方法,其特征在于,累计所述8.一种机群平台,其特征在于,包括工作参数采集单元,用于在第一时刻T = t时,采集机群的工作参数,该工作参数用以 描述机群的运行状况;误差率矫正项单元,用于根据预先设定的误差分布规律获取第一时刻的误差率矫正项 Et,所述误差率矫正项用以描述所述工作参数在第二时刻时的第一预测值 +1与精确值之 间的误差;第一预测单元,用于根据预定方式采用所述工作参数Vt计算出第二时刻时第一预测值;权重系数单元,用于计算出第一时刻的权重系数Wt,矫汇器单元,用于根据所述第一预测值、所述权重系数以及所述误差率矫正项Et计算/V出第二时刻时的第二预测值.其中,所述第一预测值、所述权重系数以及所述误差率矫 正项Et满足根据第一时刻的所述权重系数Wt和所述误差率矫正项Et计算出第一时刻的中间值,该 第一时刻的中间值与所述第一预测值的乘积作为所述第二预测值,且根据所述第二预测值与所述第一预测值 +1的比较结果,修改所述中间值。9.根据权利要求8所述的机群平台,其特征在于,所述第一预测单元具体包括第一趋势预测模块,用于如果第一时刻T = t时的实际测量值Vt小于前一时刻T = t-i 时的实际测量值,则判定趋势为下降;则,第二时刻τ = t+Ι时的第一预测值 +1满足 以所述实际测量值Vt减去一个降值DecrementValue ; 以及,第二趋势预测模块,用于如果第一时刻T = t时的实际测量值Vt大于前一时刻T = t-1 时的实际测量值AV1,则判定趋势为上升;则,第二时刻T = t+Ι时的第一预测值Vt+1满足 以所述实际测量值Vt加上一个升值IncrementValue ;所述降值DecrementValue以及所述升值本文档来自技高网...
【技术保护点】
一种对机群运行状况进行预测的方法,其特征在于,包括:在第一时刻T=t时,采集机群的工作参数Vt,该工作参数用以描述机群的运行状况;根据预先设定的误差分布规律获取第一时刻的误差率矫正项Et,所述误差率矫正项用以描述:所述工作参数在第二时刻时的第一预测值*↓[t+1]与精确值之间的误差;根据预定方式采用所述工作参数V↓[t]计算出第二时刻时的所述第一预测值;计算出第一时刻的权重系数W↓[t];根据所述第一预测值、所述权重系数以及所述误差率矫正项E↓[t]计算出第二时刻时的第二预测值*↓[t+1];其中,所述第一预测值、所述权重系数以及所述误差率矫正项E↓[t]满足:根据第一时刻的所述权重系数W↓[t]和所述误差率矫正项E↓[t]计算出第一时刻的中间值,该第一时刻的中间值与所述第一预测值的乘积作为所述第二预测值;且根据所述第二预测值*↓[t+1]与所述第一预测值*↓[t+1]的比较结果,修改所述中间值。
【技术特征摘要】
【专利技术属性】
技术研发人员:朱晓莉,
申请(专利权)人:联想北京有限公司,
类型:发明
国别省市:11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。