一种基于回归分析的学科预测算法制造技术

技术编号:24355708 阅读:17 留言:0更新日期:2020-06-03 02:30
本发明专利技术公开了一种基于回归分析的学科预测算法,包括:基于系统初始采样数据序列计算系统线性回归预测模型的初始模型系数,并记录;随系统采样点的每次增加获取新的系统采样数据序列,确定增加的系统采样点数据和减少的系统采样点数据;基于增加/减少的系统采样点数据以及当前模型系数,更新模型系数;然后基于减少/增加的系统采样点数据以及更新后的模型系数,再次更新模型系数,作为每次系统采样点增加对应的模型系数并记录。本发明专利技术可避免计算过程中对服务器资源的大量占用,提高系统线性回归模型系数计算的效率,保障对线性回归模型系数计算的实时性。

A discipline prediction algorithm based on regression analysis

【技术实现步骤摘要】
一种基于回归分析的学科预测算法
本专利技术涉及计算机数据分析处理
,特别涉及一种基于回归分析的学科预测算法。
技术介绍
实际工业系统在运行过程中,有状态监控子系统记录系统中关键设备的运行参数,这些参数通常是温度、压力、流量、电流、电压等数据。而在对系统进行分析优化的过程中,通常更关心组件性能衰减、预期收益、运维计划等数据。这些数据并不能从监控子系统获取的数据中直观获得,而体现在这些数据的长期变化趋势中。基于对系统原理的分析,可以对系统进行线性化或者局部线性化,获得系统参数数据间的简单线性表示形式,即系统的线性模型。根据系统原理,模型中的系数与系统组件性能、转换效率,维护阈值等直接相关。因此,根据模型系数的长期变化趋势,即可实现对系统性能衰减评估、远期收益预测、运维节点优化等工作。线性化后的系统模型可记为YT=WTX,其中X=[X1X2...Xn]为若干采样点的系统输入,YT=[y1y2...]为对应采样点模型预测的系统输出,W为模型系数。实际系统中,在不同的采样点可以得到不同的实际系统输入和输出参数数值,带入到模型中构成一个超定方程组,通过最小二乘方法即可估计出模型系数W的值。因此可根据预测采样点之前的若干组系统实际参数,估算系统在预测采样点的模型系数,进而根据模型系数的变化趋势进行系统性能分析。最小二乘法在模型维数较高,或者方程组计算的数据参数组数较大时,涉及到大量矩阵运算,并需要对中间矩阵求逆,耗费大量计算资源。因此,在服务器上对系统模型进行详细分析计算时,会占用大量系统计算资源。一方面增加服务器压力,同时也会降低对系统模型详细分析求解的可行性。为了充分消除随机误差以及突发干扰对模型系数估算的影响,通常在计算时需要引入较长时间范围内的系统实测数据参与运算。例如,实际计算为了获得一个采样点的模型系数,可能需要此前系统连续一个月甚至一年的运行数据。如果每次计算都需要获取如此大量数据,对服务器存储IO带宽、内存容量等都将形成巨大压力。
技术实现思路
本专利技术要解决的技术问题是克服现有技术的缺陷,提供一种基于回归分析的学科预测算法,利用迭代的方式计算模型系数,避免计算过程中对服务器资源的大量占用,提高系统线性回归模型系数计算的效率,保障对线性回归模型系数计算的实时性。为了解决上述技术问题,本专利技术提供了如下的技术方案:本专利技术提供一种基于回归分析的学科预测算法,包括以下步骤:S1,基于预设的数据窗口长度,获取系统初始采样数据序列,利用初始采样数据序列计算系统线性回归预测模型的模型系数,并记录;S2,获取增加的系统采样点数据,基于预设的数据窗口长度,形成新的系统采样数据序列;确定新的系统采样数据序列较初始采样数据序列所增加的系统采样点数据和减少的系统采样点数据;S3,基于增加/减少的系统采样点数据以及当前模型系数,更新模型系数;然后基于减少/增加的系统采样点数据以及更新后的模型系数,再次更新模型系数,并记录;S4,随系统采样点的增加重复步骤S2至步骤S4,得到每次采样点数据增加、采样数据序列变化后的模型系数,并记录。本专利技术还实现对系统性能变化的分析,即还包括步骤S5,基于已记录的模型系数对系统性能的变化进行分析。根据模型系数变化对系统性能进行分析可采用现有技术。作为一种具体实施方式,步骤S1中,对于系统模型YT=WTX,Y为对应采样输入量X的系统输出量,W为模型系数,则有中间矩阵CN=(XXT)-1,模型系数WNT=YTXTCN。考虑采用岭回归方法可有效处理采样点数据共线性高的场景,因此优选的,步骤S1中,对于系统模型YT=WTX,Y为对应采样输入量X的系统输出量,W为模型系数,则有中间矩阵CN=(XXT+λI)-1,λ为岭回归系数,I为单位矩阵,当前模型系数矩阵WNT=YTXTCN。即可在初始化时将方法整体更改为岭回归方法。步骤S2中,每当增加一个采样点数据,即写入采样数据窗,该新写入的采样点数据即所述“增加的系统采样点数据”。由于采样数据窗基于预设的数据长度,因此初始数据序列中采样时间最早的采样点数据将被“挤”出采样数据窗,该被“挤”出的采样点数据即所述“减少的采样点数据”。采样数据窗的窗口长度可根据需要进行设定,为现有技术:步骤S3中,可先根据增加的系统采样点数据以及当前模型系数进行模型系数的更新,然后再根据减少的系统采样点数据以及当前模型系数进行模型系数的更新,亦可顺序反之。优选的,基于增加的系统采样点数据以及当前模型系数进行模型系数更新包括:定义输入量初始采样数据序列矩阵为:X=[xN-m+1...xN],输出量采样数据矩阵为:YT=[yN-m+1...yN],增加的输入量/输出量系统采样点数据为xN+1/yN+1,构成矩阵x+=xN+1/y+=yN+1;则采样点数据增加后的中间矩阵为:CN+=CN-CNx+(I+x+TCNx+)x+TCN,采样点数据增加后的模型系数矩阵为:WN+T=WNT-WNTx+(I+x+TCNx+)x+TCN+y+Tx+TCN+;将采样点数据增加后的中间矩阵CN+和模型系数矩阵WN+更新为当前中间矩阵CN和当前模型系数矩阵WN。优选的,基于减少的系统采样点数据以及当前模型系数进行模型系数更新包括:定义减少的输入量/输出量系统采样点数据为xN-m+1/yN-m+1,构成矩阵x_=xN-m+1/y_=yN-m+1,则采样点数据减少后的中间矩阵为:CN-=CN+CNx_(I+x_TCNx_)x_TCN,采样点数据减少后的模型系数矩阵为:WN-T=WNT+WNTx_(I+x_TCNx_)x_TCN-y_Tx_TCN-将采样点数据减少后的中间矩阵CN-和模型系数矩阵WN-T更新为当前中间矩阵CN和当前模型系数矩阵WN。步骤S1中,初始数据序列的窗口长度根据需要以及计算机计算能力调整,若实际已经得到的初始数据序列较长,假设为M,可设定较小的m作为数据窗长度,利用S1得到基于m个采样数据序列的模型系数作为初始模型系数,然后利用步骤2至步骤3,逐次增加采样点m之后的各采样点数据,每次序列变化都得到相应的模型系数并记录作为当前模型系数,迭代至下一次模型系数的计算中,直至得到对应采样数据点M的模型系数。优选的,步骤S1、S3以及S4中,分别将计算得到的模型系数结果记录为对应相应采样数据序列中最新采样点的模型系数。与现有技术相比,本专利技术的有益效果如下:1.利用迭代的方式计算模型系数,每次迭代只需从监控系统或既有数据库获取增加的模型采样值,和数量不变的历史输入采样值,与采样窗口长度无关。即使迭代对应的采样窗口长度为1年甚至更长,实际每个迭代步骤只取用很少数据,可降低对服务器存储IO带宽、内存容量等的要求。2.迭代过程下一步计算只依赖上一步求得模型系数和中间矩阵,它们是方法相邻迭代间的状态量。假定模型系数维数为k,则状态量数值只有k*(k+1)个。因此只本文档来自技高网
...

【技术保护点】
1.一种基于回归分析的学科预测算法,其特征在于,包括以下步骤:/nS1,基于预设的数据窗口长度,获取系统初始采样数据序列,利用初始采样数据序列计算系统线性回归预测模型的模型系数,并记录;/nS2,获取增加的系统采样点数据,基于预设的数据窗口长度,形成新的系统采样数据序列;确定新的系统采样数据序列较初始采样数据序列所增加的系统采样点数据和减少的系统采样点数据;/nS3,基于增加/减少的系统采样点数据以及当前模型系数,更新模型系数;然后基于减少/增加的系统采样点数据以及更新后的模型系数,再次更新模型系数,并记录;/nS4,随系统采样点的增加重复步骤S2至步骤S4,得到每次采样点数据增加、采样数据序列变化后的模型系数,并记录。/n

【技术特征摘要】
1.一种基于回归分析的学科预测算法,其特征在于,包括以下步骤:
S1,基于预设的数据窗口长度,获取系统初始采样数据序列,利用初始采样数据序列计算系统线性回归预测模型的模型系数,并记录;
S2,获取增加的系统采样点数据,基于预设的数据窗口长度,形成新的系统采样数据序列;确定新的系统采样数据序列较初始采样数据序列所增加的系统采样点数据和减少的系统采样点数据;
S3,基于增加/减少的系统采样点数据以及当前模型系数,更新模型系数;然后基于减少/增加的系统采样点数据以及更新后的模型系数,再次更新模型系数,并记录;
S4,随系统采样点的增加重复步骤S2至步骤S4,得到每次采样点数据增加、采样数据序列变化后的模型系数,并记录。


2.根据权利要求1所述的一种基于回归分析的学科预测算法,其特征在于,还包括步骤S5,基于已记录的模型系数对系统性能的变化进行分析。


3.根据权利要求1所述的一种基于回归分析的学科预测算法,其特征在于,步骤S1中,对于系统模型YT=WTX,Y为对应采样输入量X的系统输出量,W为模型系数,则有中间矩阵CN=(XXT)-1,模型系数WNT=YTXTCN。


4.根据权利要求1所述的一种基于回归分析的学科预测算法,其特征在于,步骤S1中,对于系统模型YT=WTX,Y为对应采样输入量X的系统输出量,W为模型系数,则有中间矩阵CN=(XXT+λI)-1,λ为岭回归系数,I为单位矩阵,当前模型系数矩阵WNT=YTXTCN。


5.根据权利要求3或4所述的一种基于回归分析的学科预测算法,其特征在于,基...

【专利技术属性】
技术研发人员:贾新志
申请(专利权)人:上海骥灏网络股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1