System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 结合LSTM与多图卷积神经网络的选股方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>浙江大学专利>正文

结合LSTM与多图卷积神经网络的选股方法及系统技术方案

技术编号:43963304 阅读:0 留言:0更新日期:2025-01-07 21:48
本发明专利技术公开了一种结合LSTM与多图卷积神经网络的选股方法及系统,本发明专利技术方法的步骤如下:获取原始的股票特征数据,并按照股票代码进行分类,由预处理后的股票特征数据构建数据集;训练包含LSTM模型、图卷积网络、Attention机制以及全连接层的选股模型,将待检测股票的股票特征数据输入到训练好的选股模型中预测未来收益率,按照未来收益率的大小进行排序,选取收益率最高的前K支待检测股票进行投资。本发明专利技术的方法通过动态捕获股票关系影响,实现历史特征嵌入和股票关系嵌入相结合,可以有效提高模型预测准确性,为投资者提供投资选择,从而获得更高额的投资回报率。

【技术实现步骤摘要】

本专利技术属于数据处理领域,尤其涉及一种结合lstm与多图卷积神经网络的选股方法及系统。


技术介绍

1、随着经济发展水平提高,金融市场日渐扩大,股票因其潜在的高额回报率而备受投资者亲睐,已经成为最具吸引力的投资选择之一。股票投资者能否获得利润本质上取决于所选股票价格在未来会上升,因此,能否有效预测股票的未来价格和走势至关重要。

2、量化投资通过建模方式使这一过程变得更加科学,后来随着信息化时代的到来和人工智能技术发展,更多算法被用于股票预测。通过大量数据捕获各种股票特征,如历史价格数据、交易量等,与收益回报之间的关系,进而实现有效的股票收益率预测,并根据预测结果选择股票,最终获得超额投资回报。

3、目前用于股票预测的深度学习模型仍存在着一些问题,首先在进行股票预测时只考虑到股票价格与其历史数据序列的关系。可是在现实市场中,股票并非独立存在,它们之间存在大量关联,例如,处于竞争关系的两家公司,股票价格呈现此消彼长的状态,而具有供应关系的公司,股价很可能呈现同样的变化趋势。其次,基于股票关系图的方法,通常都以静态关系图为基础,根据先验知识构建股票关系图,无法准确反映股票关系的变化。并且,生成的关系图只从某个单一角度出发(比如行业关系,wiki关系,投资关系),不能充分包含股票间的所有关系。

4、lstm是rnn的一种变体,最初被提出是为了解决rnn在反向传播过程中容易产生梯度消失或梯度爆炸的问题,能够很好地捕捉和利用长期的时间序列依赖关系。它通过输入门、输出门和遗忘门,可以自动对信息进行筛选,忽略无效部分,保留重要信息。股票价格被看作为一种典型的时间序列。而lstm模型能够很好地捕获序列长期依赖关系,在保留原始数据趋势特征的情况下,降低数据复杂度。因此在金融领域被广泛应用。

5、有效市场假说证明,股票价格可以完全反映市场信息。基于此观点,通过计算股票历史价格序列间的关系,可以动态反应股票间的关系。attention可以自适应地关注输入信息的重要性,可以更加有效整合根据不同角度出发所计算得到的关系图对不同股票的重要程度,获得一张更加完成的股票关系图。图上顶点表示股票节点,而边值表示每对股票间相关性的强度。gcn是一种广泛应用于图上的深度学习方法,它通过对图中相邻节点进行聚合,捕获节点间的关系,并为每个节点生成新的特征表示,从而实现节点间的交叉信息影响,得到股票相互作用后的结果。

6、在进行股票预测的过程中,股票价格不仅与其自身的历史序列有关,还会受到其他相关股票的影响。因此,借助lstm对于时间序列长期依赖关系的处理能力和多图卷积神经网络对于相邻节点关系的捕获能力,可以更加全面地获取市场信息,从而实现准确且高效地股票数据分析和预测,得到一种新的量化选股方法。


技术实现思路

1、本专利技术的目的在于解决现有技术中存在的问题,并提供一种结合lstm与多图卷积神经网络的选股方法及系统,本专利技术的方法可以有效提高预测准确率,并提高投资收益率。

2、为了实现上述专利技术目的,本专利技术具体采用如下技术方案:

3、第一方面,本专利技术提供了一种结合lstm与多图卷积神经网络的选股方法,包括以下步骤:

4、s1:获取原始的股票特征数据,并按照股票代码对原始的股票特征数据进行分类;

5、s2:对分类后的股票特征数据进行数据预处理,得到预处理后的股票特征数据,并由预处理后的股票特征数据构建数据集;

6、s3:在所述数据集上训练选股模型,所述选股模型包含lstm模型、图卷积网络、attention机制以及全连接层;

7、s4:获取经过数据预处理的待检测股票的股票特征数据,将待检测股票的股票特征数据输入到训练好的选股模型中,由选股模型预测每支待检测股票的未来收益率,按照未来收益率的大小对待检测股票的股票特征数据进行排序,选取收益率最高的前k支待检测股票进行投资。

8、在上述方案基础上,各步骤可以采用如下优选的具体方式实现。

9、作为上述第一方面的优选,步骤s2中,所述数据预处理具体过程为:依次对分类后的股票特征数据进行中心化以及归一化后,利用中心化以及归一化后的股票特征数据计算股票价格移动平均线。

10、作为上述第一方面的优选,步骤s3中,选股模型中的具体处理流程如下:

11、s31:将预处理后的股票特征数据输入到所述lstm模型中提取各支股票的股票趋势特征;

12、s32:从原始的股票特征数据中获取股票的历史收盘价序列,基于股票的历史收盘价序列计算每对股票间的皮尔逊相关系数,得到皮尔逊关系矩阵,基于股票的历史收盘价序列计算每对股票间的斯皮尔曼秩相关系数,得到斯皮尔曼秩关系矩阵,并通过fastdtw算法获得股票的历史收盘价序列之间的相似度,得到相似关系矩阵;

13、s33:将皮尔逊关系矩阵、斯皮尔曼秩关系矩阵以及相似关系矩阵通过attention机制整合为一个注意力关系矩阵,所述注意力关系矩阵中的每个元素代表对应索引的两支股票之间的关系强度;

14、s34:将注意力关系矩阵中的每个元素作为股票关系图的边值,将各支股票的股票趋势特征作为股票关系图中的股票节点,以构建股票关系图;

15、s35:将股票关系图输入到图卷积网络中,进行两层图卷积过程后获得各支股票的关系嵌入;

16、s36:将各支股票的股票趋势特征以及各支股票的关系嵌入拼接在一起,将拼接后的结果通过一个全连接层进行预测结果处理,得到各支股票收益率的预测结果。

17、作为上述第一方面的优选,步骤s3中,在训练选股模型时,采用的损失函数具体为:

18、

19、

20、

21、式中:l1代表预测损失,l2表示每对股票间相对排名的损失;表示在t+1时间所有股票收益率的预测结果;yt+1表示在t+1时间所有股票收益率的真实值;α表示权重超参数;分别表示在t+1时间第i支股票、第j支股票收益率的预测结果;分别表示在t+1时间第i支股票、第j支股票收益率的真实值。

22、第二方面,本专利技术提供了一种结合lstm与多图卷积神经网络的选股系统,包括:

23、数据获取模块,用于获取原始的股票特征数据,并按照股票代码对原始的股票特征数据进行分类;

24、预处理模块,用于对分类后的股票特征数据进行数据预处理,得到预处理后的股票特征数据,并由预处理后的股票特征数据构建数据集;

25、模型训练模块,用于在所述数据集上训练选股模型,所述选股模型包含lstm模型、图卷积网络、attention机制以及全连接层;

26、结果获取模块,用于获取经过数据预处理的待检测股票的股票特征数据,将待检测股票的股票特征数据输入到训练好的选股模型中,由选股模型预测每支待检测股票的未来收益率,按照未来收益率的大小对待检测股票的股票特征数据进行排序,选取收益率最高的前k支待检测股票进行投资。

...

【技术保护点】

1.一种结合LSTM与多图卷积神经网络的选股方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种结合LSTM与多图卷积神经网络的选股方法,其特征在于,步骤S2中,所述数据预处理具体过程为:依次对分类后的股票特征数据进行中心化以及归一化后,利用中心化以及归一化后的股票特征数据计算股票价格移动平均线。

3.如权利要求1所述的一种结合LSTM与多图卷积神经网络的选股方法,其特征在于,步骤S3中,选股模型中的具体处理流程如下:

4.如权利要求1所述的一种结合LSTM与多图卷积神经网络的选股方法,其特征在于,步骤S3中,在训练选股模型时,采用的损失函数具体为:

5.一种结合LSTM与多图卷积神经网络的选股系统,其特征在于,包括:

6.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时,能实现如权利要求1~4任一项所述的一种结合LSTM与多图卷积神经网络的选股方法。

7.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1~4任一项所述的一种结合LSTM与多图卷积神经网络的选股方法。

8.一种计算机电子设备,其特征在于,包括存储器和处理器;

...

【技术特征摘要】

1.一种结合lstm与多图卷积神经网络的选股方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种结合lstm与多图卷积神经网络的选股方法,其特征在于,步骤s2中,所述数据预处理具体过程为:依次对分类后的股票特征数据进行中心化以及归一化后,利用中心化以及归一化后的股票特征数据计算股票价格移动平均线。

3.如权利要求1所述的一种结合lstm与多图卷积神经网络的选股方法,其特征在于,步骤s3中,选股模型中的具体处理流程如下:

4.如权利要求1所述的一种结合lstm与多图卷积神经网络的选股方法,其特征在于,步骤s3中,在训练选...

【专利技术属性】
技术研发人员:张朋赵欣欣
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1