当前位置: 首页 > 专利查询>温州大学专利>正文

一种基于核极限学习机的风险预测的方法和装置制造方法及图纸

技术编号:13903132 阅读:111 留言:0更新日期:2016-10-26 00:02
本发明专利技术适用于计算机领域,提供了一种基于核极限学习机的风险预测的方法和装置,旨在解决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值,导致风险预测精确度不高的问题。方法包括:获取预定数量的企业的经营数据;对经营数据进行标准化;利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和核宽;基于优化后的惩罚系数和核宽构建核极限学习机的预测模型;根据预测模型进行风险预测。通过本发明专利技术的技术方案,将灰狼算法融入核极限学习机来确定惩罚系数和核宽的最佳值,构建出更加准确的预测模型,实现对风险的有效预测,提高预测精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。

【技术实现步骤摘要】

本专利技术涉及计算机
,尤其涉及一种基于核极限学习机的风险预测的方法和装置
技术介绍
为了减少企业经营风险尤其是破产风险对金融机构造成的损失,通过建立安全有效的风险预警机制并对企业经营风险进行预测的方法,是金融机构保持投资回报的有效方式。目前已有的企业经营风险预测方法主要可分为两类,即基于统计学模型的方法和基于人工智能的方法。基于统计学模型的预测方法主要有单变量分析法、多元判别分析法、罗吉斯特回归模型和因子分析法。相比于基于统计学模型的预测方法,基于人工智能的预测方法因其优越的性能而被广泛应用于金融风险预测领域。当前,基于人工智能的预测方法主要有基于人工神经网络、基于支持向量机、基于k近邻、基于贝叶斯模型、基于极限学习机、基于混合模型以及集成学习等方法,这些方法都已经成功的应用于金融风险预测领域。其中,基于人工神经网络的方法由于其能够较好地捕捉数据中的非线性关系而得到广泛地应用收。但基于人工神经网络的方法因通常采用梯度下降法进行学习而存在易陷入局部最小值的不足,同时网络构建过程也需要对大量的参数进行调整而难以建立起最优的模型。为了克服神经网络的这些缺点,出现了一种新的神经网络学习方法即极限学习机。由于极限学习机具有良好的学习泛化能力,基于极限学习的模型已经开始应用于金融破产预测、经济生命周期预测和企业信用评估等风险预测和评估中。由于极限学习机的输入参数值随机产生,导致模型的性能不够稳定,为了解决该问题,核极限学习机的概念被提出。相比于极限学习机,核极限学习机不需要随机设置输入层和隐藏层的权值,因而能够获得更高的训练速度,基于核极限学习机的企业经营风险预测相比其他预测方法更加准确。然而,现有研究表明核极限学习机的性能易受两个参数影响,即惩罚系数和核宽。惩罚系数用于确定拟合误差最小化和输入之间的权衡重量最小化,核宽定义了从输入空间到高维特征空间的非线性映射关系。这两个关键参数需要预先确定,如何确定最优的惩罚系数和最优的核宽,一直未获得较好的解决,目前,通常采用的方法是利用网格搜索方法确定它们的值,但网络搜索方法易陷入局部最优,因而导致风险预测的精确度不高。
技术实现思路
本专利技术的目的在于提供一种基于核极限学习机的风险预测的方法和装置,旨在解决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值,导致风险预测的精确度不高的问题。本专利技术的第一方面,提供一种基于核极限学习机的风险预测的方法,包括:获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;对所述经营数据进行标准化;基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;根据所述预测模型进行风险预测。本专利技术的第二方面,提供一种基于核极限学习机的风险预测的装置,包括:数据获取模块,用于获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;标准化模块,用于对所述经营数据进行标准化;灰狼优化模块,用于基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;模型构建模块,用于基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;预测模块,用于根据所述预测模型进行风险预测。本专利技术与现有技术相比存在的有益效果是:通过将灰狼算法融入核极限学习机来确定核极限学习机的惩罚系数和核宽,由于灰狼算法通过模仿自然界中狼群的社会等级和猎食行为获得问题的最优解,因此具有更好的搜索能力,能够确定核极限学习机的惩罚系数和核宽的最佳值,从而可以构建出更加准确的核极限学习机的预测模型,实现对企业经营风险的有效预测,并大大提高了预测的精确度,在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。附图说明图1是本专利技术实施例一提供的一种基于核极限学习机的风险预测的方法的流程图;图2是本专利技术实施例二提供的一种基于核极限学习机的风险预测的方法的流程图;图3是本专利技术实施例三提供的一种基于核极限学习机的风险预测的装置的结构示意图;图4是本专利技术实施例四提供的一种基于核极限学习机的风险预测的装置的结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。以下结合具体附图对本专利技术的实现进行详细的描述。实施例一:图1是本专利技术实施例一提供的一种基于核极限学习机的风险预测的方法的流程图,具体包括步骤S101至S104,详述如下:S101、获取预定数量的企业的经营数据,该经营数据包括预定个数的属性特征的特征值。具体地,企业经营数据指从会计学角度定义的企业当前经济状况的属性特征,属性特征代表一系列的金融比率,具体可以但不限于包括现金/流动负债比(cash/current liabilities)、现金/总资产比(cash/total assets)、流动资产/流动负载比(current assets/current liabilities)、流动资产/总资产比(current assets/total assets)、营运资金/总资产比(working capital/total assets)、营运资金/销售额比(working capital/sales)、销售额/库存比(sales/inventory)、销售额/应收账款比(sales/receivables)等。在预定数量的企业中,每一个企业都提供预定个数的属性特征,这些预定数量的企业的预定个数的属性特征的特征值构成全部经营数据。S102、对经营数据进行标准化。具体地,在每一个企业的经营数据中,对每一个属性特征均进行标准化处理,使得标准化处理后的经营数据能够准确有效的支撑灰狼算法的实现。进一步地,可以按照公式(1)对经营数据进行标准化处理: s y [ i ] ′ = s y [ i ] - s [ i ] min s [ 本文档来自技高网
...

【技术保护点】
一种基于核极限学习机的风险预测的方法,其特征在于,包括:获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;对所述经营数据进行标准化;基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;根据所述预测模型进行风险预测。

【技术特征摘要】
1.一种基于核极限学习机的风险预测的方法,其特征在于,包括:获取预定数量的企业的经营数据,所述经营数据包括预定个数的属性特征的特征值;对所述经营数据进行标准化;基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽,所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化,所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系;基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型;根据所述预测模型进行风险预测。2.根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述对所述经营数据进行标准化包括:按如下公式对所述经营数据进行标准化: s y [ i ] ′ = s y [ i ] - s [ i ] m i n s [ i ] m a x - s [ i ] m i n ]]>其中,sy[i]'为第y个企业的第i个属性特征标准化后的特征值,sy[i]为第y个企业的第i个属性特征的特征值,s[i]max为所述预定数量的企业的第i个属性特征的最大值,s[i]min为所述预定数量的企业的第i个属性特征的最小值,y∈[1,Y],Y为所述预定数量的企业,i∈[1,I],I为所述预定个数的属性特征。3.根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述基于标准化后的所述经营数据,利用灰狼算法优化核极限学习机的惩罚系数和核宽,得到优化后的惩罚系数和优化后的核宽包括:初始化灰狼参数,所述灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γmin,γmax];按如下公式设置每一只灰狼的位置Xm,并建立灰狼位置矩阵Xm=(xm1,xm2) X → = x 11 x 12 x 21 x 22 . . . x M 1 x M 2 ]]>其中,xm1为灰狼m在当前位置时所述惩罚系数的值,xm2为灰狼m在当前位置时所述核宽的值,m∈[1,M],xm1∈[Cmin,Cmax],xm2∈[γmin,γmax];根据标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代,并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代,直到达到所述最大迭代次数T为止,输出当前灰狼位置矩阵中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ。4.根据权利要求3所述的基于核极限学习机的风险预测的方法,其特征在于,所述根据标准化后的所述经营数据计算灰狼的适应度,并按照所述适应度对灰狼进行排序,更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代,并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代,直到达到所述最大迭代次数T为止,输出当前灰狼位置矩阵中头狼的位置,根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ包括:计算所述每一只灰狼的适应度fm,所述适应度fm为基于Xm计算得到的所述核极限学习机的准确度ACC,所述准确度ACC为基于标准化后的所述经营数据的K折交叉验证获取的平均准确度,所述准确度ACC的计算公式为: A C C = Σ 1 K acc k K ]]>其中,acck为第k折交叉验证的准确度,K为大于0的整数;按照所述适应度fm对灰狼进行排序,得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置按照如下公式分别计算所述灰狼α、所述灰狼β和所述灰狼δ距离猎物的距离和 D α → = | C 1 → · X α → - X → | ]]> D β → = | C 2 → · X β → - X → | ]]> D δ → = | C 3 → · X δ → - X → | ]]>其中,和通过公式计算得到,为[0,1]之间的随机数;按照如下公式完成对灰狼位置矩阵的更新: X → = X 1 → + X 2 → + X 3 → 3 ]]> X 1 → = X α → - A 1 → · ( D α → ) ]]> X 2 → = X β → - A 2 → · ( D β → ) ]]> X 3 → = X δ → - A 3 → · ( D δ → ) ]]>其中,和通过公式计算得到,t为当前迭代次数,t∈[1,T],为[0,1]之间的随机数;如果所述当前迭代次数t尚未达到所述最大迭代次数T,则根据更新后的灰狼位置矩阵继续进行灰狼优化迭代,直到所述当前迭代次数t达到所述最大迭代次数T为止;输出灰狼α的位置Xα=(xα1,xα2),其中xα1为优化后的惩罚系数C,xα2为优化后的核宽γ。5.根据权利要求1所述的基于核极限学习机的风险预测的方法,其特征在于,所述基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型包括:基于所述优化后的惩罚系数C和所述优化后的核宽γ,按照如下公式构建所述核极限学习机的预测模型: f ( s ) = K ( s , s 1 ) . . . K ( s , s N ) ( 1 C + Ω E L M ) - 1 T ]]>K(s,sn)=exp(-γ||s-sn||2...

【专利技术属性】
技术研发人员:陈慧灵赵学华王名镜童长飞蔡振闹李俊沈立明王科杰朱彬磊
申请(专利权)人:温州大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1