一种基于核极限学习机的风险预测的方法和装置制造方法及图纸

技术编号：13903132 阅读：122 留言：0更新日期：2016-10-26 00:02

本发明专利技术适用于计算机领域，提供了一种基于核极限学习机的风险预测的方法和装置，旨在解决现有技术中无法确定核极限学习机的惩罚系数和核宽的最佳值，导致风险预测精确度不高的问题。方法包括：获取预定数量的企业的经营数据；对经营数据进行标准化；利用灰狼算法优化核极限学习机的惩罚系数和核宽，得到优化后的惩罚系数和核宽；基于优化后的惩罚系数和核宽构建核极限学习机的预测模型；根据预测模型进行风险预测。通过本发明专利技术的技术方案，将灰狼算法融入核极限学习机来确定惩罚系数和核宽的最佳值，构建出更加准确的预测模型，实现对风险的有效预测，提高预测精确度，在辅助金融机构对企业经营风险进行科学合理有效的预测中具有重要的应用价值。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，尤其涉及一种基于核极限学习机的风险预测的方法和装置。
技术介绍
为了减少企业经营风险尤其是破产风险对金融机构造成的损失，通过建立安全有效的风险预警机制并对企业经营风险进行预测的方法，是金融机构保持投资回报的有效方式。目前已有的企业经营风险预测方法主要可分为两类，即基于统计学模型的方法和基于人工智能的方法。基于统计学模型的预测方法主要有单变量分析法、多元判别分析法、罗吉斯特回归模型和因子分析法。相比于基于统计学模型的预测方法，基于人工智能的预测方法因其优越的性能而被广泛应用于金融风险预测领域。当前，基于人工智能的预测方法主要有基于人工神经网络、基于支持向量机、基于k近邻、基于贝叶斯模型、基于极限学习机、基于混合模型以及集成学习等方法，这些方法都已经成功的应用于金融风险预测领域。其中，基于人工神经网络的方法由于其能够较好地捕捉数据中的非线性关系而得到广泛地应用收。但基于人工神经网络的方法因通常采用梯度下降法进行学习而存在易陷入局部最小值的不足，同时网络构建过程也需要对大量的参数进行调整而难以建立起最优的模型。为了克服神经网络的这些缺点，出现了一种新的神经网络学习方法即极限学习机。由于极限学习机具有良好的学习泛化能力，基于极限学习的模型已经开始应用于金融破产预测、经济生命周期预测和企业信用评估等风险预测和评估中。由于极限学习机的输入参数值随机产生，导致模型的性能不够稳定，为了解决该问题，核极限学习机的概念被提出。相比于极限学习机，核极限学习机不需要随机设置输入层和隐藏层的权值，因而能够获得更高的训练速度，基于核极限学习机的企业经营...

【技术保护点】
一种基于核极限学习机的风险预测的方法，其特征在于，包括：获取预定数量的企业的经营数据，所述经营数据包括预定个数的属性特征的特征值；对所述经营数据进行标准化；基于标准化后的所述经营数据，利用灰狼算法优化核极限学习机的惩罚系数和核宽，得到优化后的惩罚系数和优化后的核宽，所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化，所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系；基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型；根据所述预测模型进行风险预测。

【技术特征摘要】
1.一种基于核极限学习机的风险预测的方法，其特征在于，包括：获取预定数量的企业的经营数据，所述经营数据包括预定个数的属性特征的特征值；对所述经营数据进行标准化；基于标准化后的所述经营数据，利用灰狼算法优化核极限学习机的惩罚系数和核宽，得到优化后的惩罚系数和优化后的核宽，所述优化后的惩罚系数用于确定拟合误差最小化以及输入数据之间的权衡重量最小化，所述优化后的核宽为从输入空间到高维特征空间的非线性映射关系；基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型；根据所述预测模型进行风险预测。2.根据权利要求1所述的基于核极限学习机的风险预测的方法，其特征在于，所述对所述经营数据进行标准化包括：按如下公式对所述经营数据进行标准化： s y [ i ] ′ = s y [ i ] - s [ i ] m i n s [ i ] m a x - s [ i ] m i n ]]>其中，sy[i]'为第y个企业的第i个属性特征标准化后的特征值，sy[i]为第y个企业的第i个属性特征的特征值，s[i]max为所述预定数量的企业的第i个属性特征的最大值，s[i]min为所述预定数量的企业的第i个属性特征的最小值，y∈[1,Y]，Y为所述预定数量的企业，i∈[1,I]，I为所述预定个数的属性特征。3.根据权利要求1所述的基于核极限学习机的风险预测的方法，其特征在于，所述基于标准化后的所述经营数据，利用灰狼算法优化核极限学习机的惩罚系数和核宽，得到优化后的惩罚系数和优化后的核宽包括：初始化灰狼参数，所述灰狼参数包括最大迭代次数T、灰狼个数M、惩罚系数C的搜索范围[Cmin,Cmax]和核宽γ的搜索范围[γmin,γmax]；按如下公式设置每一只灰狼的位置Xm，并建立灰狼位置矩阵Xm＝(xm1,xm2) X → = x 11 x 12 x 21 x 22 . . . x M 1 x M 2 ]]>其中，xm1为灰狼m在当前位置时所述惩罚系数的值，xm2为灰狼m在当前位置时所述核宽的值，m∈[1,M]，xm1∈[Cmin,Cmax]，xm2∈[γmin,γmax]；根据标准化后的所述经营数据计算灰狼的适应度，并按照所述适应度对灰狼进行排序，更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代，并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代，直到达到所述最大迭代次数T为止，输出当前灰狼位置矩阵中头狼的位置，根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ。4.根据权利要求3所述的基于核极限学习机的风险预测的方法，其特征在于，所述根据标准化后的所述经营数据计算灰狼的适应度，并按照所述适应度对灰狼进行排序，更新灰狼位置得到更新后的灰狼位置矩阵完成一次灰狼优化迭代，并根据所述更新后的灰狼位置矩阵继续进行所述灰狼优化迭代，直到达到所述最大迭代次数T为止，输出当前灰狼位置矩阵中头狼的位置，根据所述头狼的位置得到优化后的惩罚系数C和优化后的核宽γ包括：计算所述每一只灰狼的适应度fm，所述适应度fm为基于Xm计算得到的所述核极限学习机的准确度ACC，所述准确度ACC为基于标准化后的所述经营数据的K折交叉验证获取的平均准确度，所述准确度ACC的计算公式为： A C C = Σ 1 K acc k K ]]>其中，acck为第k折交叉验证的准确度，K为大于0的整数；按照所述适应度fm对灰狼进行排序，得到具有最高适应度的灰狼α的位置具有次高适应度的灰狼β的位置和适应度第三高的灰狼δ的位置按照如下公式分别计算所述灰狼α、所述灰狼β和所述灰狼δ距离猎物的距离和 D α → = | C 1 → · X α → - X → | ]]> D β → = | C 2 → · X β → - X → | ]]> D δ → = | C 3 → · X δ → - X → | ]]>其中，和通过公式计算得到，为[0，1]之间的随机数；按照如下公式完成对灰狼位置矩阵的更新： X → = X 1 → + X 2 → + X 3 → 3 ]]> X 1 → = X α → - A 1 → · ( D α → ) ]]> X 2 → = X β → - A 2 → · ( D β → ) ]]> X 3 → = X δ → - A 3 → · ( D δ → ) ]]>其中，和通过公式计算得到，t为当前迭代次数，t∈[1,T]，为[0，1]之间的随机数；如果所述当前迭代次数t尚未达到所述最大迭代次数T，则根据更新后的灰狼位置矩阵继续进行灰狼优化迭代，直到所述当前迭代次数t达到所述最大迭代次数T为止；输出灰狼α的位置Xα＝(xα1,xα2)，其中xα1为优化后的惩罚系数C，xα2为优化后的核宽γ。5.根据权利要求1所述的基于核极限学习机的风险预测的方法，其特征在于，所述基于所述优化后的惩罚系数和所述优化后的核宽构建所述核极限学习机的预测模型包括：基于所述优化后的惩罚系数C和所述优化后的核宽γ，按照如下公式构建所述核极限学习机的预测模型： f ( s ) = K ( s , s 1 ) . . . K ( s , s N ) ( 1 C + Ω E L M ) - 1 T ]]>K(s,sn)＝exp(-γ||s-sn||2...

【专利技术属性】
技术研发人员：陈慧灵，赵学华，王名镜，童长飞，蔡振闹，李俊，沈立明，王科杰，朱彬磊，
申请(专利权)人：温州大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人