基于随机森林和LSTM的投资风险预测方法、系统、存储介质技术方案

技术编号:32820901 阅读:13 留言:0更新日期:2022-03-26 20:18
本发明专利技术公开了基于随机森林和LSTM的投资风险预测方法、系统、存储介质,涉及金融投资领域。本发明专利技术的方法包括获取第一时间段的股票数据集,将未来收益率作为决策因子,利用随机森林模型算出该股票的未来收益率,并筛选出未来收益率高于给定阈值概率最高的一定数量的股票;将一定数量的股票分组,调整组内各只股票的权重,筛选出收益率最高的投资组合;利用LSTM模型,对得到的投资组合进行风险预测,确认该投资组合未来的风险程度;根据随机森林模型和LSTM模型,确定得到高收益低风险的投资组合。本发明专利技术解决了现有金融产品投资决策中,相互之间存在很大出入以及投资组合合理可靠性差,投资组合预测准确性和可靠性低的问题。投资组合预测准确性和可靠性低的问题。投资组合预测准确性和可靠性低的问题。

【技术实现步骤摘要】
基于随机森林和LSTM的投资风险预测方法、系统、存储介质


[0001]本专利技术属于金融投资领域,特别是涉及基于随机森林和LSTM的投资风险预测方法、系统、存储介质。

技术介绍

[0002]随机森林模型是一种利用多棵决策树对样本进行训练并预测的分类器,目前在医疗、金融、气象等多种领域中已有广泛应用。随机森林模型能够处理大量的输入变数,评估变数的重要性,从而实现分类决策。
[0003]LSTM模型是一种具有记忆长短期信息的能力的神经网络,目前在时序数据、金融、文本事件等领域中已有广泛应用。LSTM模型能基于事件序列预测接下来会发生的事情,有一定的预测能力,利用LSTM模型对未来的发展进行预测,进而实现风险评估。
[0004]在金融领域,通常使用随机森林模型进行金融产品投资决策。由于股票类产品本身涉及到的特征参数数量非常之多,并且该特征参数具有很强的时效性,因此随机森林模型在相隔很短的时间内预测出的组合投资产品可能会有很大的出入。
[0005]因此,如何确认得到的投资组合合理可靠,如何为投资者提供准确可信的投资组合预测,成为本领域技术人员亟待解决的技术问题。

技术实现思路

[0006]本专利技术提供了基于随机森林和LSTM的投资风险预测方法、系统、存储介质,解决了以上问题。
[0007]为解决上述技术问题,本专利技术是通过以下技术方案实现的:
[0008]本专利技术的基于随机森林和LSTM的投资风险预测方法,包括如下步骤:
[0009]S01、获取第一时间段的股票数据集,将未来收益率作为决策因子,利用随机森林模型算出该股票的未来收益率,并筛选出未来收益率高于给定阈值概率最高的一定数量的股票;
[0010]S02、利用随机森林模型将一定数量的股票分组,调整组内各只股票的权重,筛选出收益率最高的投资组合;
[0011]S03、利用LSTM模型,对得到的投资组合进行风险预测,确认该投资组合未来的风险程度;
[0012]S04、根据所述的随机森林模型和LSTM模型,确定得到高收益低风险的投资组合。
[0013]进一步地,所述S01步骤具体包括如下分步骤:
[0014]S011、获取全A股票第一时间段各只股票的收盘价和开盘价、涨跌幅、成交量、市盈率、市净率、换手率中的任意一种或多种,作为对应股票历史数据以来用于预测未来一年收益率;
[0015]S012、将所述历史数据输入收益预测模型,设置收益率阈值为X%,以输出每只股票在未来的收益率高于该阈值的概率,并按大小排序,筛选出概率最高的一定数量的股票;
其中,所述收益预测模型是利用随机森林模型训练获得;所述X根据具体情况自行设置。
[0016]进一步地,所述S012步骤是通过如下步骤进行:
[0017]将开盘价、涨跌幅、成交量、市盈率、市净率、换手率中的任意一种或多种作为协助因子,与第一时间段的收益率的部分数据一同训练所述收益预测模型,剩下的数据作为测试集;
[0018]将所述第一时间段的收益率输入所述收益预测模型,以输出所述股票在未来预设时间段收益率高于X%的概率;
[0019]将得到的概率按大小顺序,以得到未来收益率高于X%概率最高的一定数量的股票。
[0020]进一步地,所述S02步骤具体包括如下分步骤:
[0021]S021、运用随机森林模型的决策树思维将这一定数量的股票分成不同的组合,调整各只股票在这个组合中的权重,计算出每个组合在未来预设时间段的收益率;
[0022]S022、将收益率按照大小排序,选择出收益率最高的投资组合。
[0023]进一步地,所述S03步骤包括如下分步骤:
[0024]S031、选取第一时间段A股中的优质投资组合,取部分历史数据作为训练集训练LSTM模型,剩下的部分作为测试集,以检验模型的准确率,通过检验得到RMSE数据,设置阈值;若RMSE高于阈值,则修改参数,重新编写模型;
[0025]S032、将随机森林模型得到的投资组合输入风险预测模型,以输出该投资组合未来一段时间内的风险,如果风险较大,则重新选择投资组合进行预测;
[0026]S033、根据收益预测模型和风险预测模型,筛选出低风险高收益的投资组合。
[0027]进一步地,所述收益预测模型的训练过程包括:
[0028]获取所述A股中多只股票的第二历史业绩数据,所述第二历史业绩数据包括所述多只股票在训练时间点第一时间段内的业绩数据;
[0029]将所述第二历史业绩数据划分为多个不同训练样本和测试样本,每个测试样本包括其中一只股票在第二时间段之内的业绩数据,所述第二时间段小于第一时间段;
[0030]将所述训练样本训练所述收益预测模型,运用随机森林模型对样本数据进行选择,判断未来收益率高于阈值的投资组合,并利用所述测试样本对所述收益预测模型进行测试。
[0031]进一步地,所述股票分组具体是通过以下训练过程实现:
[0032]获取A股中多只股票数据,并运用决策树算法将股票分成不同的投资组合;
[0033]根据收益预测模型算出各投资组合的预期收益,调整各只股票所占权重以及实现收益率最大化。
[0034]进一步地,所述风险预测模型的训练包括如下步骤:
[0035]获取所述A股多只股票的第二历史业绩数据,所述第二历史业绩数据包括所述多只股票在训练时间点之前第一时间段内的业绩数据;
[0036]将所述A股多只股票运用股票分组得到收益率高的一定数量的股票投资组合;
[0037]将所述投资组合数据划分为多个不同训练样本和测试样本;
[0038]利用所述训练样本数据训练所述风险预测模型,并利用所述测试样本对所述风险预测模型进行测试。
[0039]基于随机森林和LSTM的投资风险预测系统,包括处理器,所述处理器用于在运行时,执行基于随机森林和LSTM的投资风险预测方法。
[0040]一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现基于随机森林和LSTM的投资风险预测方法。
[0041]本专利技术相对于现有技术包括有以下有益效果:
[0042]本专利技术基于随机森林和LSTM的投资风险预测方法,通过获取第一时间段的股票数据集,拆分训练集和测试集,设置收益率阈值,将数据带入至随机森林模型,筛选出未来收益率高于该阈值可能性最高的一定数量的股票,将筛选出来的股票运用随机森林进行分类组合,选出收益率最高的收益组合,将投资组合代入LSTM模型,预测风险,筛选出高收益低风险的投资组合,解决了现有金融产品投资决策中,由于预测时间短,相互之间存在很大出入以及投资组合合理可靠性差,投资组合预测准确性和可靠性低的问题。
[0043]当然,实施本专利技术的任一产品并不一定需要同时达到以上所述的所有优点。
附图说明
[0044]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述所需要使本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于随机森林和LSTM的投资风险预测方法,其特征在于,包括如下步骤:S01、获取第一时间段的股票数据集,将未来收益率作为决策因子,利用随机森林模型算出该股票的未来收益率,并筛选出未来收益率高于给定阈值概率最高的一定数量的股票;S02、利用随机森林模型将一定数量的股票分组,调整组内各只股票的权重,筛选出收益率最高的投资组合;S03、利用LSTM模型,对得到的投资组合进行风险预测,确认该投资组合未来的风险程度;S04、根据所述的随机森林模型和LSTM模型,确定得到高收益低风险的投资组合。2.根据权利要求1所述的基于随机森林和LSTM的投资风险预测方法,其特征在于,所述S01步骤具体包括如下分步骤:S011、获取全A股票第一时间段各只股票的收盘价和开盘价、涨跌幅、成交量、市盈率、市净率、换手率中的任意一种或多种,作为对应股票历史数据以来用于预测未来一年收益率;S012、将所述历史数据输入收益预测模型,设置收益率阈值为X%,以输出每只股票在未来的收益率高于该阈值的概率,并按大小排序,筛选出概率最高的一定数量的股票;其中,所述收益预测模型是利用随机森林模型训练获得;所述X根据具体情况自行设置。3.根据权利要求2所述的基于随机森林和LSTM的投资风险预测方法,其特征在于,所述S012步骤是通过如下步骤进行:将开盘价、涨跌幅、成交量、市盈率、市净率、换手率中的任意一种或多种作为协助因子,与第一时间段的收益率的部分数据一同训练所述收益预测模型,剩下的数据作为测试集;将所述第一时间段的收益率输入所述收益预测模型,以输出所述股票在未来预设时间段收益率高于X%的概率;将得到的概率按大小顺序,以得到未来收益率高于X%概率最高的一定数量的股票。4.根据权利要求1所述的基于随机森林和LSTM的投资风险预测方法,其特征在于,所述S02步骤具体包括如下分步骤:S021、运用随机森林模型的决策树思维将这一定数量的股票分成不同的组合,调整各只股票在这个组合中的权重,计算出每个组合在未来预设时间段的收益率;S022、将收益率按照大小排序,选择出收益率最高的投资组合。5.根据权利要求1所述的基于随机森林和LSTM的投资风险预测方法,其特征在于,所述S03步骤包括如下分步骤:S031、选取第一时间段A股中的优质投资组合,取部分历史数据作为训练集训练LSTM模型,剩下的部分作为测试...

【专利技术属性】
技术研发人员:陆洋张苇金基东
申请(专利权)人:上海卡方信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1