基于低质量数据的ARMA模型参数估计方法及系统技术方案

技术编号:30137624 阅读:15 留言:0更新日期:2021-09-23 14:51
本发明专利技术针对ARMA模型的观测数据可能是低质量的(如数据部分丢失、观测数据明显异常等),从而导致对ARMA模型的参数估计不准确的情况,提出了一种基于低质量数据的ARMA模型参数估计方法及系统,本发明专利技术方法包括以下步骤:步骤1:收集采样数据,建立信号模型;步骤2:初始化模型中所需的参数;步骤3:计算丢失数据的期望;步骤4:计算对数似然函数的期望;步骤5:更新参数;步骤6:判断是否满足迭代次数,若不满足,则执行步骤3;若满足,则结束。本发明专利技术利用统计方法获得低质量数据的数学期望,进而结合线性回归和最大似然方法推导出ARMA模型的参数估计,从而实现对ARMA模型参数的估计,该方法有着较好的估计性能和收敛性。法有着较好的估计性能和收敛性。法有着较好的估计性能和收敛性。

【技术实现步骤摘要】
基于低质量数据的ARMA模型参数估计方法及系统


[0001]本专利技术属于时间序列ARMA(自回归滑动平均)模型
,具体说是一种基于低质量数据的ARMA模型参数估计方法及系统。

技术介绍

[0002]ARMA模型是一种重要的时间序列分析模型,能够用来描述实际应用中的许多问题,在金融、气象水文、海洋学、信号处理等领域都有着广泛的应用。因此,基于ARMA模型系统的相关理论和方法受到了大量关注,目前这些方法的基本思路常常被归结为,把ARMA模型看作一个线性回归模型,并利用获得的观测数据实现对该模型参数的准确估计,从而建立准确的ARMA模型,用来拟合实际的系统。值得注意的是,在实际应用中,环境干扰或观测条件等因素可能会导致ARMA模型系统输出的部分观测数据丢失或者观测数据明显异常的情况(以下将这些丢失的输出数据和异常数据统称为丢失数据)。由于ARMA模型可以等价为一个线性回归模型,因此ARMA模型部分输出的观测数据的丢失等价于线性回归模型输入矢量信号的丢失,从而导致无法有效地实现模型参数的估计。

技术实现思路

[0003]针对上述问题,本专利技术提供了一种基于低质量数据的ARMA模型参数估计方法及系统。
[0004]本专利技术采取如下技术方案:
[0005]一种基于低质量数据的ARMA模型参数估计方法,包括以下步骤:
[0006]步骤1:收集采样数据,建立信号模型;
[0007]步骤2:初始化模型中所需的参数;
[0008]步骤3:计算丢失数据的期望;
[0009]步骤4:计算对数似然函数的期望;
[0010]步骤5:更新参数;
[0011]步骤6:判断是否满足迭代次数,若不满足,则执行步骤3;若满足,则结束。
[0012]优选的,步骤1具体如下:假设一个平稳随机过程ARMA模型,其输入和输出具有如下形式:其中a0=1,a1,a2,

,a
L
为自回归模型(AR)的系数,b1,b2,

,b
Q
为滑动平均模型(MA)的系数,AR部分和MA 部分的系数为待估计的参数,u
k,i
为系统的输入,v
k
为高斯白噪声,服从均值为 0、方差为σ2的高斯分布,即v
k
~N(0,σ2)。将AR部分和MA部分的系数用向量a和b表示,输入项用向量u
k
表示,模型反馈项用表示,因此信号模型改写为:
[0013]本专利技术中对ARMA模型的参数估计,考虑了在实际的情况下,环境干扰或观测条件等因素可能会导致ARMA模型系统输出的部分观测数据丢失或者观测数据明显异常的情况。
给定N个输入信号集合U={u1,u2,

,u
N
},那么根据信号模型,相应的输出测量集合为Y
N
={y1,y2,

,y
N
}。假设的输出测量集合Y
N
中,部分测量数据是丢失的,也就是说集合Y
N
可以分为2个子集合,即Y
N
={Y
M
,Y
O
},其中Y
M
为丢失的输出数据,Y
O
为可观测的输出数据;集合O={o1,o2,

,o
a
}和集合M={m1,m2,

,m
b
}分别表示可观测数据和丢失数据的时间索引,即k∈O时, y
k
是可观测的,而k∈M时,y
k
是丢失的数据。本专利技术所提供的方法是利用系统的输入U和可观测的输出Y
O
来实现对模型参数{a1,a2,

,a
L
,b1,b2,

,b
Q
}的估计。
[0014]优选的,步骤2具体如下:初始化:设置待估计参数的初始值a,b,初始值设置为0。
[0015]优选的,步骤3具体如下:计算丢失数据的期望:利用统计的方法获得丢失数据的数学期望,用来替代丢失数据。
[0016]优选的,步骤4具体如下:EM算法中的E步:利用步骤1中的信号模型可以得到D
O
和Y
M
的联合概率密度P(D
O
,Y
M
|Θ),其中D
O
={U,Y
O
}。之后再进一步求解其中Θ
(i)
={a
(i)
,b
(i)
}。E步表示根据当前Θ
(i)
的值和D
O
值对应的Y
M
的条件概率密度计算对数似然函数 logP(D
O
,Y
M
|Θ)的期望。
[0017]优选的,步骤5具体如下:EM算法中的M步:最大化步骤4得到的函数Θ(Θ|Θ
(i)
),求解参数Θ
(i)
={a
(i)
,b
(i)
}。
[0018]优选的,步骤6具体如下:停止迭代的条件:当满足迭代次数后停止循环,否则重新执行步骤3、步骤4和步骤5,直到满足迭代次数。
[0019]本专利技术还公开了一种基于低质量数据的ARMA模型参数估计系统,其包括以下模块:
[0020]数据收集及信号模型建立模块,收集采样数据,建立信号模型;
[0021]初始化模块,初始化模型中所需的参数;
[0022]丢失数据期望计算模块,计算丢失数据的期望;
[0023]对数似然函数期望计算模块,计算对数似然函数的期望;
[0024]更新参数模块,更新参数;
[0025]迭代次数判断模块,判断是否满足迭代次数。
[0026]优选的,数据收集及信号模型建立模块具体如下:假设一个平稳随机过程ARMA模型,其输入和输出具有如下形式:其中a0=1, a1,a2,

,a
L
为自回归模型(AR)的系数,b1,b2,

,b
Q
为滑动平均模型(MA) 的系数,AR部分和MA部分的系数为待估计的参数,u
k,i
为系统的输入,v
k
为高斯白噪声,服从均值为0、方差为σ2的高斯分布,即v
k
~N(0,σ2);将AR部分和MA部分的系数用向量a和b表示,输入项用向量u
k
表示,模型反馈项用表示,因此信号模型改写为:
[0027]给定N个输入信号集合U={u1,u2,

,u
N
},根据信号模型,相应的输出测量集合为Y
N
={y1,y2,

,y
N
};假设的输出测量集合Y
N
中,部分测量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于低质量数据的ARMA模型参数估计方法,其特征在于,包括以下步骤:步骤1:收集采样数据,建立信号模型;步骤2:初始化模型中所需的参数;步骤3:计算丢失数据的期望;步骤4:计算对数似然函数的期望;步骤5:更新参数;步骤6:判断是否满足迭代次数,若不满足,则执行步骤3;若满足,则结束。2.如权利要求1所述基于低质量数据的ARMA模型参数估计方法,其特征在于,步骤1具体如下:假设一个平稳随机过程ARMA模型,其输入和输出具有如下形式:其中a0=1,a1,a2,

,a
L
为自回归模型AR的系数,b1,b2,

,b
Q
为滑动平均模型MA的系数,AR部分和MA部分的系数为待估计的参数,u
k,i
为系统的输入,v
k
为高斯白噪声,服从均值为0、方差为σ2的高斯分布,即v
k
~N(0,σ2);将AR部分和MA部分的系数用向量a和b表示,输入项用向量u
k
表示,模型反馈项用表示,因此信号模型改写为:给定N个输入信号集合U={u1,u2,

,u
N
},根据信号模型,相应的输出测量集合为Y
N
={y1,y2,

,y
N
};假设的输出测量集合Y
N
中,部分测量数据是丢失的,即集合Y
N
可分为2个子集合,即Y
N
={Y
M
,Y
O
},其中Y
M
为丢失的输出数据,Y
O
为可观测的输出数据;集合O={o1,o2,

,o
a
}和集合M={m1,m2,

,m
b
}分别表示可观测数据和丢失数据的时间索引,即k∈O时,y
k
是可观测的,而k∈M时,y
k
是丢失的数据。3.如权利要求2所述基于低质量数据的ARMA模型参数估计方法,其特征在于,步骤2具体如下:设置待估计参数的初始值a,b,初始值设置为0。4.如权利要求3所述基于低质量数据的ARMA模型参数估计方法,其特征在于,步骤3具体如下:利用统计方法获得丢失数据的数学期望,用来替代丢失数据。5.如权利要求4所述基于低质量数据的ARMA模型参数估计方法,其特征在于,步骤4具体如下:利用步骤1中的信号模型得到D
O
和Y
M
的联合概率密度P(D
O
,Y
M
|Θ),其中D
O
={U,Y
O
};之后再进一步求解其中Θ
(i)
={a
(i)
,b
(i)
};E步表示根据当前Θ
(i)
的值和D
O
值对应的Y
M
的条件概率密度计算对数似然函数logP(D
O
,Y
M
|Θ)的期望;和/或,步骤5具体如下:最大化步骤4得到的函数Θ(Θ|Θ
(i)
),从而求解参数Θ
(i)
={a
(i)
,b
(i)
}。6.基于低质量数据的ARMA模型参数估计系统,其特征在于,包括以下模块:数...

【专利技术属性】
技术研发人员:王亚峰刘兆霆鲍辉明
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1