一种债券利率预测方法、系统、计算机设备及存储介质技术方案

技术编号:38430373 阅读:14 留言:0更新日期:2023-08-07 11:27
本发明专利技术公开了一种债券利率预测方法、系统、计算机设备及存储介质,包括:从数据库中抽取债券数据集;对抽取的债券数据集进行数据整理后得到模型数据集;将模型数据集输入到XGBoost模型中进行处理,输出模型数据集中各变量的特征重要性,根据特征重要性筛选变量得到模型训练集;将模型训练集输入到MLR模型中进行训练,得到结果A;将模型训练集输入到XGBoost模型中进行训练,得到结果B;将结果A和结果B作为自变量,利用MLR模型进行拟合,得到拟合方程:利率=w1*结果A+w2*结果B;将待测债券数据分别输入MLR模型和XGBoost模型对应输出待测债券的结果a和结果b,将结果a和结果b带入拟合方程,得到待测债券的利率预测值。本发明专利技术方法可实现对于债券利率的有效预测。明方法可实现对于债券利率的有效预测。明方法可实现对于债券利率的有效预测。

【技术实现步骤摘要】
一种债券利率预测方法、系统、计算机设备及存储介质


[0001]本专利技术涉及数据处理
,具体涉及一种债券利率预测方法、系统、计算机设备以及非易失性计算机可读存储介质。

技术介绍

[0002]债券利率是政府、银行以及企业等在国际金融市场和国内金融市场上以发行债券方式筹措资金,对债券购买者所支付的利率。
[0003]目前,现有技术中,基于金融科技对债券利率预测的常用方法是时间序列和线性回归,其中,时间序列的缺陷是考虑的影响因素有限,特征单一,且对时序平稳性有强制要求,导致实际预测结果波动较大;线性回归的缺陷是模型简单,需要很强的人工进行规则筛选判定,非行业专业人士很难做出有效预判,缺乏灵活性,另外预测结果不容易调优。
[0004]综上所述,如何提供一种债券利率预测方法、系统、计算机设备以及非易失性计算机可读存储介质,以实现对于债券利率的有效预测,是目前本领域技术人员亟待解决的问题。
[0005]因此,现有技术还有待改进和提高。

技术实现思路

[0006]鉴于上述现有技术的不足之处,本专利技术的目的在于提供一种可用于金融科技或其他相关领域的债券利率预测方法、系统、计算机设备以及非易失性计算机可读存储介质,旨在实现对于债券利率的有效预测。
[0007]为了达到上述目的,本专利技术采取了以下技术方案:
[0008]一种债券利率预测方法,其中,包括:
[0009]从数据库中抽取债券数据集,所述债券数据集内包括有多个变量;
[0010]对抽取的所述债券数据集进行数据整理后得到模型数据集;
[0011]将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到模型训练集;
[0012]将所述模型训练集输入到MLR模型中进行训练,得到结果A;
[0013]将所述模型训练集输入到XGBoost模型中进行训练,得到结果B;
[0014]将所述结果A和所述结果B作为自变量,利用MLR模型进行拟合,得到拟合方程:利率=w1*结果A+w2*结果B,w1和w2为拟合系数;
[0015]将待测债券数据分别输入MLR模型和XGBoost模型中进行处理,对应输出所述待测债券的结果a和结果b,将所述待测债券的结果a和结果b带入所述拟合方程内,以得到所述待测债券的利率预测值。
[0016]在进一步的技术方案中,所述的债券利率预测方法,其中,所述对抽取的所述债券数据集进行数据整理后得到模型数据集,具体包括:
[0017]对抽取的所述债券数据集进行数据筛选;
[0018]利用TOAD对筛选后的所述债券数据集进行卡方分箱后得到分箱数据;
[0019]利用WOETransformer函数对所述分箱数据进行WOE转化后得到模型数据集。
[0020]在进一步的技术方案中,所述的债券利率预测方法,其中,所述将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到模型训练集,具体包括:
[0021]将所述模型数据集输入到XGBoost模型中进行处理;
[0022]利用feature_importance函数输出所述模型数据集中各所述变量的特征重要性评分;
[0023]根据所述特征重要性评分对各所述变量倒排,筛选变量得到模型测试集和模型训练集。
[0024]在进一步的技术方案中,所述的债券利率预测方法,其中,所述根据所述特征重要性评分对各所述变量倒排,筛选变量得到模型测试集和模型训练集,具体包括:
[0025]根据所述特征重要性评分对各所述变量倒排,筛选前20%的所述变量作为模型测试集,剩余的所述变量作为模型训练集。
[0026]在进一步的技术方案中,所述的债券利率预测方法,其中,所述对抽取的所述债券数据集进行数据筛选,具体包括:
[0027]对所述债券数据集中的重复数据进行清除;
[0028]对所述债券数据集中的缺失率大于等于第一预设阈值的变量进行清除;
[0029]对所述债券数据集中的缺失率小于所述第一预设阈值的变量进行填充;
[0030]对所述债券数据集中的相关性大于等于第二预设阈值的变量仅保留一个,其余清除;
[0031]对所述债券数据集中的各变量依次计算其IV(informationvalue)值,保留IV值大于等于第三预设阈值的变量,其余清除。
[0032]在进一步的技术方案中,所述的债券利率预测方法,其中,所述第一预设阈值为50%,所述第二预设阈值为0.6,所述第三预设阈值为0.1。
[0033]在进一步的技术方案中,所述的债券利率预测方法,其中,所述从数据库中抽取债券数据集中,所述债券数据集包括:新发行债券数据、银行间回购交易数据和政策性金融债到期收益数据。
[0034]一种债券利率预测系统,其中,包括:
[0035]抽取模块,用于从数据库中抽取债券数据集,所述债券数据集内包括有多个变量;
[0036]数据整理模块,用于对抽取的所述债券数据集进行数据整理后得到模型数据集;
[0037]处理筛选模块,用于将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到模型训练集;
[0038]第一训练模块,用于将所述模型训练集输入到MLR模型中进行训练,得到结果A;
[0039]第二训练模块,用于将所述模型训练集输入到XGBoost模型中进行训练,得到结果B;
[0040]拟合模块,用于将所述结果A和所述结果B作为自变量,利用MLR模型进行拟合,得到拟合方程:利率=w1*结果A+w2*结果B,w1和w2为拟合系数;
[0041]利率预测模块,用于将待测债券数据分别输入MLR模型和XGBoost模型中进行处
理,对应输出所述待测债券的结果a和结果b,将所述待测债券的结果a和结果b带入所述拟合方程内,以得到所述待测债券的利率预测值。
[0042]在进一步的技术方案中,所述的债券利率预测系统,其中,所述对抽取的所述债券数据集进行数据整理后得到模型数据集,具体包括:
[0043]对抽取的所述债券数据集进行数据筛选;
[0044]利用TOAD对筛选后的所述债券数据集进行卡方分箱后得到分箱数据;
[0045]利用WOETransformer函数对所述分箱数据进行WOE转化后得到模型数据集。
[0046]在进一步的技术方案中,所述的债券利率预测系统,其中,所述将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到模型训练集,具体包括:
[0047]将所述模型数据集输入到XGBoost模型中进行处理;
[0048]利用feature_importance函数输出所述模型本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种债券利率预测方法,其特征在于,包括:从数据库中抽取债券数据集,所述债券数据集内包括有多个变量;对抽取的所述债券数据集进行数据整理后得到模型数据集;将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到模型训练集;将所述模型训练集输入到MLR模型中进行训练,得到结果A;将所述模型训练集输入到XGBoost模型中进行训练,得到结果B;将所述结果A和所述结果B作为自变量,利用MLR模型进行拟合,得到拟合方程:利率=w1*结果A+w2*结果B,w1和w2为拟合系数;将待测债券数据分别输入MLR模型和XGBoost模型中进行处理,对应输出所述待测债券的结果a和结果b,将所述待测债券的结果a和结果b带入所述拟合方程内,以得到所述待测债券的利率预测值。2.根据权利要求1所述的债券利率预测方法,其特征在于,所述对抽取的所述债券数据集进行数据整理后得到模型数据集,具体包括:对抽取的所述债券数据集进行数据筛选;利用TOAD对筛选后的所述债券数据集进行卡方分箱后得到分箱数据;利用WOETransformer函数对所述分箱数据进行WOE转化后得到模型数据集。3.根据权利要求2所述的债券利率预测方法,其特征在于,所述将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到模型训练集,具体包括:将所述模型数据集输入到XGBoost模型中进行处理;利用feature_importance函数输出所述模型数据集中各所述变量的特征重要性评分;根据所述特征重要性评分对各所述变量倒排,筛选变量得到模型测试集和模型训练集。4.根据权利要求3所述的债券利率预测方法,其特征在于,所述根据所述特征重要性评分对各所述变量倒排,筛选变量得到模型测试集和模型训练集,具体包括:根据所述特征重要性评分对各所述变量倒排,筛选前20%的所述变量作为模型测试集,剩余的所述变量作为模型训练集。5.根据权利要求2所述的债券利率预测方法,其特征在于,所述对抽取的所述债券数据集进行数据筛选,具体包括:对所述债券数据集中的重复数据进行清除;对所述债券数据集中的缺失率大于等于第一预设阈值的变量进行清除;对所述债券数据集中的缺失率小于所述第一预设阈值的变量进行填充;对所述债券数据集中的相关性大于等于第二预设阈值的变量仅保留一个,其余清除;对所述债券数据集中的各变量依次计算其IV(informationvalue)值,保留IV值大于等于第三预设阈值的变量,其余清除。6.根据权利要求5所述的债券利率预测方法,其特征在于,所述第一预设阈值为50%,所述第二预设阈值为0.6,所述第三预设阈值为0.1。7.根据权利要求1

6任一项所述的债券利率预测方法,其特征在于,所述从数据库中抽
取债券数据集中,所述债券数据集包括:新发行债券数据、银行间回购交易数据和政策性金融债到期收益数据。8.一种债券利率预测系统,其特征在于,包括:抽取模块,用于从数据库中抽取债券数据集,所述债券数据集内包括有多个变量;数据整理模块,用于对抽取的所述债券数据集进行数据整理后得到模型数据集;处理筛选模块,用于将所述模型数据集输入到XGBoost模型中进行处理,输出所述模型数据集中各所述变量的特征重要性,根据所述特征重要性筛选变量得到...

【专利技术属性】
技术研发人员:蔡凡华毛佩芳
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1