System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于多模态图神经网络的金融时间序列预测方法技术_技高网

一种基于多模态图神经网络的金融时间序列预测方法技术

技术编号:40258678 阅读:10 留言:0更新日期:2024-02-02 22:49
本发明专利技术公开一种基于多模态图神经网络的金融时间序列预测方法,金融时间序列分析在对冲市场风险和优化投资决策方面发挥着核心作用,伴随着多模态流和超前滞后效应。例如,股票的价格走势是不同扩散速度下复杂市场状态的反映,包括历史价格序列、媒体新闻、相关事件等。此外,金融行业要求预测模型具有可解释性和合规性。本发明专利技术提出一种多模态图神经网络(MAGNN)来从这些多模态输入中学习以进行金融时间序列预测,异构图网络是由金融知识图谱中的源作为节点和关系作为边构建的,利用两阶段注意机制进行联合优化,允许最终用户研究内部模态和间模态源的重要性来确保模型的可解释性。

【技术实现步骤摘要】

本专利技术涉及基于多模态图神经网络的金融时间序列对金融市场预测领域,通过多模态图神经网络来解决金融行业预测模型的问题。


技术介绍

1、2019年美国本土上市公司金融市值达到30万亿美元,占美国国内生产总值(gdp)的1.5倍以上,在这个庞大而波动的市场中,预测股票的价格走势对于金融机构和投资者来说都非常重要,根据有效市场假说(emh),理想情况下,股票的价格反映了有效市场中的所有可用信息,包括历史价格、新闻、事件等。然而,在现实情况下,不同的股票会做出反应对不同事件的控制是不直观且不同步的。因此,在时间序列预测框架中对这种复杂的现象(称为超前效应)进行建模具有挑战性。

2、金融行业自二十世纪初以来一直在研究价格预测模型,并从那时起完善这些技术,在此过程中投资了数百万美元,传统的定量方法依赖历史时间序列价格数据来预测股价走势,这些模型旨在通过提取有意义的技术指标和/或潜在特征来减少随机性并捕获一致的模式。近年来,随着社交媒体和自然语言处理技术的发展,非结构化新闻被用来提高预测模型的能力,但这些技术并没有捕捉股票之间的内部关系,这限制了它们在预测模型中的潜力。例如,“高通对苹果提起诉讼”事件的词条特征无法区分上诉人“高通”和被上诉人“苹果”,因此很难推断相关股票、高通和苹果公司相应的价格走势。

3、最近,研究人员倾向于通过从媒体新闻中提取结构事件元组和指标(即情绪指标)来改善市场信息的表示。主要思想是学习相似事件或相似情绪新闻可能具有相似特征的分布式表示。然后将这些特征与上市公司联系起来,并与历史时间序列相结合以进行价格预测,但两个类似的事件可能完全无关,例如“史蒂夫·乔布斯退出苹果”和“大卫·彼得离开星巴克”,为了克服这个问题,在特征学习过程中使用来自知识图(kg)的外部信息,那么,上述两个事件根据kg的语义差异可以有不同的表示,因为史蒂夫·乔布斯是苹果公司的创始人,而大卫·彼得更像是星巴克的顾客。

4、然而,股票在金融市场上的价格变动不仅取决于其自身的个别事件,还与其他股票的联系有关,这些多模态输入,包括数字时间序列、非结构化文本和关系图,对价格变动产生不同的协同效应。例如,“高通起诉苹果”事件也会以不同的扩散速度影响智能手机市场的其他参与者(即竞争对手、上下游企业),如三星、富士康、谷歌等。有效预测价格由于金融领域知识的不完整性和复杂的顺序模式,从超前滞后效应中分析相关股票具有挑战性。


技术实现思路

1、本专利技术针对现有解决方案的局限性和挑战,提出了一种多模态图神经网络模型,通过结合超前滞后关系的来源(包括历史价格、媒体事件和kg的相应知识)来预测价格变动。首先从原始新闻中提取链接实体的关系,然后将它们存储在我们的金融知识图(finkg)中。紧接着提出一种异构图注意力网络来学习目标时间序列的统一表示,其中多模态源被定义为源节点,预测权益被定义为目标节点,利用两阶段注意力机制(内部模态和模态间注意力)来推断内部顺序模式和源间超前滞后关系,内部模态注意机制旨在自动学习每个模态输入中图结构源对目标节点的不同贡献,而跨模态注意力被提出来动态学习不同模态之间的权重,以对目标节点进行适当的价格变动预测,因为不同模态在不同时间段的贡献不同,最后,将学习到的信息特征输入预测层以进行价格变动预测。

2、本专利技术的一种基于多模态图神经网络的金融时间序列预测方法,包含以下步骤:

3、s1:问题预定义

4、s2:异构图的构建过程

5、s3:模型框架和输入

6、s4:内部模态图注意力

7、s5:跨模态源注意力

8、s6:目标预测网络及优化。

9、进一步地,所述s1的具体步骤为:

10、s11、在信息有效的市场中,股票的价格变动可以被视为对金融事件或新闻的反应,然而,当新事件冲击股市时,某些股票的价格反应比其他股票更快,这种相关但异步的价格变动现象被称为超前滞后效应;例如,当一个新事件(“高通针对苹果”)冲击市场时,不仅会带来“高通”和“苹果”的价格波动,还会影响上下游企业,例如三星(苹果在智能手机市场的供应商和主要竞争对手)和富士康(苹果的制造商),但它们的价格变动是异步的,因为不同实体的事件扩散速度不同,因此,从金融市场的这种超前滞后关系中学习是一项具有挑战性的任务。

11、进一步地,所述s2的具体步骤为:

12、s21、多模态异构图利用多模态源扩展了传统的异构图,图节点分为六种类型(源、新闻、事件、市场、桥梁和目标节点),具有三种模态输入(数字时间序列、媒体文本和关系),给出定义如下:

13、定义1异构图,异构图表示为g=(vt,vs,e),其中vt表示目标节点的集合,vs表示源节点的集合,e是连接节点之间的链路的集合;

14、定义2源节点,vs通过映射函数vs→φ与不同的模态相关联,其中φ表示模态集,包括数字市场数据、媒体文本和关系;

15、定义3目标节点,vt是在图中预测的权益,旨在通过有向链接接收和聚合来自其他节点的消息;

16、定义4桥节点,表示多模态源和目标节点之间的连接节点,从领域知识图finkg中提取的;

17、定义5属性节点,包括新闻、事件和市场节点,这些节点仅连接到其主题公司,多模态输入被视为异构图中的节点,它们可以通过链接将消息传递到其他节点;

18、定义6边(e)是连接节点之间的一组连线,包括有向边和无向边,公司之间的关系(源节点、目标节点或桥节点)是有向的,从主体到客体,公司与其所属节点之间的连接是无向的。

19、进一步地,所述s3的具体步骤为:

20、s31、首先通过知识图谱中的事件、新闻、关系和市场数据构建异构图,然后,多模态输入并行地输入到内模态图注意层(inngat),其中每个模态输入由inngat在异构图上独立学习,多模态源注意力(intsat)采用inngat的输出并从所有模态学习高阶表示,最后,将学习到的特征输入前馈和分类网络以进行目标预测;

21、s32、采用预训练的bert1作为新闻嵌入模型,并从大型财经新闻语料库中对bert模型进行微调,对于事件元组提取,利用广泛使用的openie并利用张量神经网络学习的结构化元组的嵌入作为事件特征,在finkg构建中,使用opennre2从海量新闻文本中提取关系并将其存储在知识图谱finkg中,如果事件(或新闻)的实体是上市公司,将其标记为源节点,其余实体在知识图中表示为桥节点,当一组事件命中finkg时,提取所提及实体的相邻节点和对应关系作为基础图,然后,将预测的股票标记为目标节点,然后,将新闻、事件和市场数据链接到各个实体,最终形成异构图。

22、进一步地,所述s4的具体步骤为:

23、s41、给定每个模态输入特征和构建的异构图,内部模态图注意力被设计为将信息从源节点传播和聚合到目标节点,inngat的输入包括源节点和目标节点的预训练嵌入,其中φ∈{n,e,p本文档来自技高网...

【技术保护点】

1.一种基于多模态图神经网络的金融时间序列预测方法,其特征在于包含以下步骤:

2.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤S1中:问题预定义的具体步骤为;

3.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤S2的具体方法为:

4.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤S3中的具体方法为:

5.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤S4中的具体步骤为:

6.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤S5中的具体步骤为:

7.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤S6中的具体步骤为:

【技术特征摘要】

1.一种基于多模态图神经网络的金融时间序列预测方法,其特征在于包含以下步骤:

2.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤s1中:问题预定义的具体步骤为;

3.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预测方法,其特征在于步骤s2的具体方法为:

4.根据权利要求1所述的一种基于多模态图神经网络的金融时间序列预...

【专利技术属性】
技术研发人员:赖俊华陈天健吴雪桐黄江
申请(专利权)人:广东工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1