一种基于集成经验模态分解和1-范数支持向量机分位数回归的金融时间序列预测方法技术

技术编号:12914309 阅读:107 留言:0更新日期:2016-02-24 19:34
本发明专利技术属于金融风险管理领域,具体为一种基于集成经验模态分解和非线性分位数回归的时间序列概率分布预测方法。该发明专利技术首先对金融价格时间序列进行集成经验模态分解,得到不同尺度下,规律性更强的分量;其次,分别对各个分量使用1-范数支持向量机分位数回归预测,得到每个分量的所有分位数预测结果。第三步,以各分位数为统计目标,将每个分量的各分位数预测结果分别进行加和,集成得到各分位数预测结果,进而得到金融价格时间序列的概率分布预测。本发明专利技术提供的方法能有效预测金融价格的变动概率,并能够应用于金融风险管理和投资实践中。

【技术实现步骤摘要】

本专利技术属于金融领域,具体涉及各种有价证券的价格、收益率的概率分布预测方 法。
技术介绍
金融时间序列,主要包括各种有价证券的价格、收益率等数据。尽管价格变动具有 很强的不确定性,但其变化之中总是蕴含着一些规律。比如,一些有经验的证券投资者可以 凭借技术指标,实现对价格的涨跌做出预测,并从中获利。发现这些规律,并将这些规律用 来预测价格的变动,对于帮助金融机构或普通投资者科学的管理风险,做出投资决策有着 重大的意义。 金融时间序列往往具有非平稳和非线性的特征,传统的线性模型很难捕捉其中的 规律。目前常用的非线性时间序列预测模型有神经网络和支持向量机等模型,这些模型能 够很好地拟合时间序列的非线性特征,进而做出预测。虽然这些智能模型的预测精度比传 统模型的要高,但要将其预测的结果应用于决策还有一定的差距。而且,这些预测是对价格 的均值做出预测,缺少了对价格变动的各种可能性的描述,这不便于投资人进行风险控制。 分位数回归模型恰恰能够估计价格变动的分布情况,它通过计算一种非对称形式的绝对值 残差最小化函数,分别估计各个分位数的回归函数。分位数回归具有很多优点,但最重要 在于它能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的均 值。 本专利技术结合集成经验模态分解和1-范数支持向量机分位数回归模型,预测金融 时间序列的变动分布情况。其中,集成经验模态分解用来将原始时间序列分解为规律性强 的分量,以提高预测精度;支持向量机分位数回归模型用来估计非线性时间序列各个分位 数的预测值。
技术实现思路
本专利技术的目的在于针对原有金融时间序列的概率分布预测方法中存在的不足,提 供一种精度较高的预测方法,以辅助投资者进行风险管理和投资决策。 时间序列预测建模的本质是通过分析序列的历史值与其未来值的关系,建立函数 关系。用xt表示已知原始金融时间序列,其中下标t表示时间,一共有T期:t = 1,2,…,T ; 如建立预测函数xt= f (X t D xt 2, . . .,xt 1+1,xt 1),(1〈T),其中1表示预测的滞后期,通过自 相关分析,并由Schwarz最小化原则确定。例如通过分析一个时间序列滞后期1为6,则使用 其t-1,t-2, . . .,t-6期的值作为自变量,来预测第t期的值。用yi表示第i个训练样本的因 变量x1+i,Xi表示第i个训练样本的自变量向量[X i, xi+1,. . .,xi+1 2, xi+1 J,则原始时间序列 {Xi, x2,. . .,χτ}可以形成一组样本数量为T-1 的训练集(Xi, y;),i = 1,2,. . .,T-1+1, T-1。对 于给定训练集(Xd 7丄(i = 1,2,. . .,T-l+1,T-l),使用1-范数支持向量机分位数回归模型 建立 Xi- yi在分位数 τ,( τ e (0, 1))的预测函数 f τ (Xi) = f\ (Xi, Xi+1, . . .,Xi+1 2, Xi+1 i)。 该专利技术第一步对金融价格时间序列进行集成经验模态分解,得到不同尺度下,规 律性更强的N+1个分解序列;第二步,分别对各个分解序列进行1-范数支持向量机分位数 回归模型预测,得到每个序列的9个分位数τ =0.1,0.2,…,0.9的预测结果。第三步, 以各分解分量为单位,基于训练好的模型外推预测各分解序列未来在各分位数下的值。第 四步,将每个序列各个分位数预测结果分别进行加和,集成得到各分位数预测结果。 所述预测方法的具体步骤如下: (1) 对原始时间序列进行集成经验模态分解; 用示原始金融时间序列{x Χ2,...,XT},其中下标t表示时间,一共有Τ期:t = 1,2,…,T ;使用集成经验模态分解算法将^进行分解,得到N个本征模态函数序列c & t,(j =1,2,. . .,N)和一个残值序列rt,分解结果用公式表示为:(2) 对各分解序列分别建立时间序列预测函数; 时间序列预测建模的本质是通过分析序列的历史值与其未来值的关系,建立函数关 系。用Xt表示原始金融时间序列{x D X2, . . .,xd,如建立预测函数xt= f (X t 1,Xt 2, . . .,Xtl+1,xtl),(1〈T),其中1表示预测的滞后期,通过自相关分析,并由Schwarz最小化原则确 定。例如通过分析一个时间序列滞后期1为6,则使用其t-1,t-2,. . .,t-6期的值作为自 变量,来预测第t期的值。用yi表示第i个训练样本的因变量X 1+1,Xl表示第i个训练样 本的自变量向量,则原始时间序列{xi,X2, . . .,xj可以形成一组 样本数量为τ-I的训练集(Xl,yi),i = 1,2, · · ·,T-1+1,T-1。对于给定训练集(Xl,yi),(i =1,2,. . .,τ-l+l,τ-l),使用1-范数支持向量机分位数回归模型建立Xl- y 1在分位数 τ,( τ e (〇, 1))的预测函数 (Xi) = (Xi, xi+1, . . .,xi+1 2, xi+1 J,其具体方法为: 对于分位数τ e (〇,1),训练1-范数支持向量机分位数回归模型的本质是通过优化 参数〇1,€(1>>,(1 = 1,2,...,1'-1+1,1'-1),其中,€[1与€[1>>为当第1个样本点预测值小于 实际值或大于实际值时对应约束条件的拉格朗日因子。使如下目标函数最小化:并满足约束条件:其中,虚拟变量L,€分别表示模型预测值小于实际值yi和大 于实际值残差,b为待估截距,C为惩罚参数。Κ(·)为径向基核函数,对于任意一组σ为径向基核函数的核宽度,一代表任意两个自变量的下标。 模型中的参数(:与σ对预测效果有重要影响,不同的时间序列可能有不同的最佳参数 组合。最佳参数组合通过网格法选取:在给定范围C,σ e ,共有19 X 19组参数。对每组参数,分别使用1-范数非线性支 持向量机分位数回归模型建立预测函数,并根据预测函数对训练集上的数据进行预测。计 算预测值与实际值之间的预测误差,选取预测误差最小的一组参数组合作为最终参数。其 中,对于分位数τ,其预测误差为:此处,Τ-1代表训练样本个数,ξ litMin表示训练集第i个样本的实际值y i大于预测值 免=Λ(χ;.)的残差,表示训练集第i个样本的实际值小于预测值λ =Λ(χ,)的残差:使用网格法确定好最佳参数C与σ后,该模型本质上是一个带线性约束条件 的线性规划问题,可以使用经典的单纯形法进行求解,得到决策变量<^,α Λ (i = 1,2, . . .,Τ-1+1,Τ-1)及截距b。对于分位数τ,( τ e (〇, 1)),其最终的预测函数如下:使用1-范数支持向量机分位数回归模型对分解得到的N+1个序列,每个序列建立9组 分位数预测函数,即τ = 0. 1,0. 2,…,0. 9共9个分位数,共得到9 X (N+1)个预测函数。 用,,(j = 1,2, . . .,Ν)表示分位数τ的第j个本征模态函数序列c]it的预测函数,f y 表示残差匕的预测函数。 (3) 基于训练好的模型进行外推预测。 使用训练集训练该模型,分别本文档来自技高网...

【技术保护点】
一种基于集成经验模态分解和1‑范数支持向量机分位数回归的金融时间序列预测方法,其特征在于,该方法包括如下操作步骤:(1)时间序列分解;用xt表示原始金融时间序列{x1,x2,...,xT},其中下标t表示时间,一共有T期:t=1,2,…,T;使用集成经验模态分解算法将xt进行分解,得到N个本征模态函数序列cj,t,(j=1,2,...,N)和一个残值序列rt,分解结果用公式表示为:xt=Σj=1Ncj,t+rt]]>(2)对各分解序列分别建立时间序列预测函数;时间序列预测建模的本质是通过分析序列的历史值与其未来值的关系,建立函数关系;用xt表示原始金融时间序列{x1,x2,...,xT},其中下标t表示时间,一共有T期:t=1,2,…,T;如建立预测函数xt=f(xt‑1,xt‑2,...,xt‑l+1,xt‑l),(l<T),其中l表示预测的滞后期,通过自相关与偏相关分析,并由Schwarz最小化原则确定;用yi表示第i个训练样本的因变量xl+i,xi表示第i个训练样本的自变量向量[xi,xi+1,...,xi+l‑2,xi+l‑1],则原始时间序列{x1,x2,...,xT}形成一组样本数量为T‑l的训练集(xi,yi),i=1,2,...,T‑l+1,T‑l;对于给定训练集(xi,yi),(i=1,2,...,T‑l+1,T‑l),使用1‑范数支持向量机分位数回归模型建立xi→yi在分位数τ,(τ∈(0,1))的预测函数fτ(xi)=fτ(xi,xi+1,...,xi+l‑2,xi+l‑1),其具体方法为:对于分位数τ∈(0,1),训练1‑范数支持向量机分位数回归模型的本质是通过优化参数αi,αi*,(i=1,2,...,T‑l+1,T‑l),其中,αi与αi*为当第i个样本点预测值小于实际值或大于实际值时对应约束条件的拉格朗日因子;使如下目标函数最小化:minαi,αi*,bΣi=1T-l(αi+αi*)+CΣi=1T-l(τξi+(1-τ)ξi*)]]>并满足约束条件:Σs=1T-l(αs-αs*)K(xs,xi)+b-yi≤ξi*,i=1,2,...,T-l;s=1,2,...,T-l,s≠i;-Σs=1T-l(αs-αs*)K(xs,xi)-b+yi≤ξi,i=1,2,...,T-l;s=1,2,...,T-l,s≠i;ξi,ξi*≥0]]>其中,虚拟变量ξi,ξi*分别表示模型预测值小于实际值yi和大于实际值yi的残差,b为待估截距,C为惩罚参数;K(·)为径向基核函数,对于任意一(t1,t2∈[1,2,...,T‑l+1,T‑l]):K(xt1,xt2)=exp(-||xt1-xt2||22σ2)]]>σ为径向基核函数的核宽度,t1,t2代表任意两个自变量的下标;模型中的参数C与σ对预测效果有重要影响,不同的时间序列可能有不同的最佳参数组合;最佳参数组合通过网格法选取:在给定范围C,σ∈[1,2,3,4,5,6,7,8,9,10,20,30,40,50,60,70,80,90,100],共有19×19组参数;对每组参数,分别使用1‑范数非线性支持向量机分位数回归模型建立预测函数,并根据预测函数对训练集上的数据进行预测;计算预测值与实际值之间的预测误差,选取预测误差最小的一组参数组合作为最终参数;其中,对于分位数τ,其预测误差为:Eτ=1T-lΣi=1T-l(τξi,train+(1-τ)ξi,train*)]]>此处,T‑l代表训练样本个数,ξi,train表示训练集第i个样本的实际值yi大于预测值的残差,表示训练集第i个样本的实际值yi小于预测值的残差:ξi,train=max{yi-fτ(xi),0}ξi,train*=max{fτ(xi)-yi,0}]]>使用网格法确定好最佳参数C与σ后,该模型本质上是一个带线性约束条件的线性规划问题,使用经典的单纯形法进行求解,得到决策变量αi,αi*,(i=1,2,...,T‑l+1,T‑l)及截距b;对于分位数τ,(τ∈(0,1)),其最终的预测函数如下:fτ(x)=Σi=1T-l(αi-αi*)K(xi,x)+b]]>使用1‑范数支持向量机分位数回归模型对分解得到的N+1个序列,每个序列建立9组分位数预测函数,即τ=0.1,0.2,…,0.9共9个分...

【技术特征摘要】

【专利技术属性】
技术研发人员:余乐安杨泽斌汤铃
申请(专利权)人:北京化工大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1