金融产品价格影响因素传导分析方法及系统技术方案

技术编号:33352370 阅读:13 留言:0更新日期:2022-05-08 10:00
本发明专利技术公开了一种金融产品价格影响因素传导分析方法及系统,在不依赖人工参与的情况下,仅使用少量标注样本,解决金融产品影响因素的传导分析。其技术方案为:对自动获取的原始数据进行预处理;基于预处理后的数据,抽取事件因果对,基于事件因果对构建事理图谱;基于语言预训练模型的构建分类算法对所构建的事理图谱中的因果事件对自动赋予标签,基于语言预训练模型自动赋予的标签用于价格影响因素的传导分析。素的传导分析。素的传导分析。

【技术实现步骤摘要】
金融产品价格影响因素传导分析方法及系统


[0001]本专利技术涉及金融产品价格波动成因的分析技术,具体涉及一种基于事理图谱的技术来实现的自动化解决包括金融衍生品在内的金融产品价格波动成因分析的方法和系统。

技术介绍

[0002]金融衍生品包括股指期货、国债期货等在优化资源配置、降低国家总体的金融风险、吸纳社会闲置资金、有效地增加市场的流动性、提高交易效率等方面起着很大作用。近些年随着国内外经济环境日趋复杂,金融衍生品价格受到货币政策、财政政策、经济基本面、市场流动性,股价涨跌等多方面长短不同周期的因素影响,影响因素间错综复杂的关系,给业务人员分析金融衍生品关键影响因素带来了巨大的困扰,为机构投资者做好风险管理提出了新的挑战。因此人们迫切需要一种自动从海量新闻中构建金融衍生品价格影响因素的方法,帮助人们从海量金融新闻中找到影响金融衍生品价格的核心影响因素并总结其演化规律。我们需要的是一个自动从新闻中提取知识、组织并构建金融事件对金融衍生品价格因果传导因素的工具或系统。
[0003]一般来说,要解决这个问题,需要人工阅读大量金融相关研报、新闻并根据专家经验对专家对宏观经济传导关系进行归纳总结,构建影响金融衍生品价格传导链路。然而由于金融领域研报和新闻获取成本高、效率低,无法满足对金融衍生品价格波动实时性分析的业务场景。
[0004]如何做到可以在不依赖人工参与的情况下来解决金融衍生品影响因素传导分析,是目前业界亟待解决的问题。然而目前市场上没有一款产品,能够自动化解决金融衍生品价格波动成因分析。

技术实现思路

[0005]以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
[0006]本专利技术的目的在于解决上述问题,提供了一种金融产品价格影响因素传导分析方法及系统,能够在不依赖人工参与的情况下,仅使用少量标注样本,基于自然语言处理相关技术解决金融产品影响因素的传导分析。
[0007]本专利技术的技术方案为:本专利技术揭示了一种金融产品价格影响因素传导分析方法,方法包括:
[0008]步骤1:对自动获取的原始数据进行预处理;
[0009]步骤2:基于预处理后的数据,抽取事件因果对,基于事件因果对构建事理图谱;
[0010]步骤3:基于语言预训练模型的构建分类算法对步骤2所构建的事理图谱中的因果事件对自动赋予标签,基于语言预训练模型自动赋予的标签用于价格影响因素的传导分
析。
[0011]根据本专利技术的金融产品价格影响因素传导分析方法的一实施例,步骤1中的原始数据包括新闻、研报在内的舆情数据,是采用分布式爬虫系统自动从互联网上抓取;预处理包括对原始数据进行去重、分词、和词性标注。
[0012]根据本专利技术的金融产品价格影响因素传导分析方法的一实施例,步骤2进一步包括:
[0013]步骤2.1:基于预处理后的数据,抽取出其中的因果触发词及所在句,作为原因、结果子句集合;
[0014]步骤2.2:针对原因、结果子句集合,使用基于规则模板的正则匹配进行事件抽取,抽取出显式因果语句中的原因子句和结果子句;
[0015]步骤2.3:针对显式因果语句中的原因子句和结果子句,基于依存句法分析确定事件表达,并构建出事理图谱。
[0016]根据本专利技术的金融产品价格影响因素传导分析方法的一实施例,步骤3进一步包括:
[0017]步骤3.1:对有标签的文本进行有监督学习;
[0018]步骤3.2:使用无监督学习框架对无标签的文本进行一致性训练;
[0019]步骤3.3:针对无标签数据和有标签数据使用半监督学习学习框架进行训练,得到损失函数,作为模型的目标优化函数用于训练,以使模型学习到无标签数据和有标签数据中的信息。
[0020]根据本专利技术的金融产品价格影响因素传导分析方法的一实施例,根据权利有安全4所述的金融产品价格影响因素传导分析方法,其特征在于,在步骤3的有监督学习中加入数据增强方式。
[0021]根据本专利技术的金融产品价格影响因素传导分析方法的一实施例,传导分析的结果以事件为节点,以事件之间的关系为边,存入图数据库中以实现可视化效果。
[0022]本专利技术还揭示了一种金融产品价格影响因素传导分析系统,系统包括:
[0023]预处理模块,对自动获取的原始数据进行预处理;
[0024]事理图谱构建模块,基于预处理后的数据,抽取事件因果对,基于事件因果对构建事理图谱;
[0025]传导分析模块,基于语言预训练模型的构建分类算法对事理图谱构建模块所构建的事理图谱中的因果事件对自动赋予标签,基于语言预训练模型自动赋予的标签用于价格影响因素的传导分析。
[0026]根据本专利技术的金融产品价格影响因素传导分析系统的一实施例,预处理模块中的原始数据包括新闻、研报在内的舆情数据,是采用分布式爬虫系统自动从互联网上抓取;预处理包括对原始数据进行去重、分词、和词性标注。
[0027]根据本专利技术的金融产品价格影响因素传导分析系统的一实施例,事理图谱构建模块进一步配置为:
[0028]抽取单元,基于预处理后的数据,抽取出其中的因果触发词及所在句,作为原因、结果子句集合;
[0029]匹配单元,针对原因、结果子句集合,使用基于规则模板的正则匹配进行事件抽
取,抽取出显式因果语句中的原因子句和结果子句;
[0030]构建单元,针对显式因果语句中的原因子句和结果子句,基于依存句法分析确定事件表达,并构建出事理图谱。
[0031]根据本专利技术的金融产品价格影响因素传导分析系统的一实施例,传导分析模块进一步配置为:
[0032]有监督学习单元,对有标签的文本进行有监督学习;
[0033]无监督学习单元,使用无监督学习框架对无标签的文本进行一致性训练;
[0034]损失函数训练单元,针对无标签数据和有标签数据使用半监督学习学习框架进行训练,得到损失函数,作为模型的目标优化函数用于训练,以使模型学习到无标签数据和有标签数据中的信息。
[0035]根据本专利技术的金融产品价格影响因素传导分析系统的一实施例,在传导分析模块的有监督学习单元中加入数据增强方式。
[0036]根据本专利技术的金融产品价格影响因素传导分析系统的一实施例,系统还包括图形化模块,配置为将传导分析的结果以事件为节点,以事件之间的关系为边,存入图数据库中,以实现可视化效果。
[0037]本专利技术对比现有技术有如下的有益效果:本专利技术的方法和系统引入了两方面的技术处理:一是结合句法模板和依存句法分析技术从研报中抽取事件因果关系构成事理图谱,二是基于语言预训练模型为金融新闻打上相应的金融分类标签便于业务人员检索和归因分析。这两方面的结合可以大大提升业务人员的新闻检索效率,在不本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种金融产品价格影响因素传导分析方法,其特征在于,方法包括:步骤1:对自动获取的原始数据进行预处理;步骤2:基于预处理后的数据,抽取事件因果对,基于事件因果对构建事理图谱;步骤3:基于语言预训练模型的构建分类算法对步骤2所构建的事理图谱中的因果事件对自动赋予标签,基于语言预训练模型自动赋予的标签用于价格影响因素的传导分析。2.根据权利要求1所述的金融产品价格影响因素传导分析方法,其特征在于,步骤1中的原始数据包括新闻、研报在内的舆情数据,是采用分布式爬虫系统自动从互联网上抓取;预处理包括对原始数据进行去重、分词、和词性标注。3.根据权利要求1所述的金融产品价格影响因素传导分析方法,其特征在于,步骤2进一步包括:步骤2.1:基于预处理后的数据,抽取出其中的因果触发词及所在句,作为原因、结果子句集合;步骤2.2:针对原因、结果子句集合,使用基于规则模板的正则匹配进行事件抽取,抽取出显式因果语句中的原因子句和结果子句;步骤2.3:针对显式因果语句中的原因子句和结果子句,基于依存句法分析确定事件表达,并构建出事理图谱。4.根据权利要求1所述的金融产品价格影响因素传导分析方法,其特征在于,步骤3进一步包括:步骤3.1:对有标签的文本进行有监督学习;步骤3.2:使用无监督学习框架对无标签的文本进行一致性训练;步骤3.3:针对无标签数据和有标签数据使用半监督学习学习框架进行训练,得到损失函数,作为模型的目标优化函数用于训练,以使模型学习到无标签数据和有标签数据中的信息。5.根据权利有安全4所述的金融产品价格影响因素传导分析方法,其特征在于,在步骤3的有监督学习中加入数据增强方式。6.根据权利要求1至5中任一项所述的金融产品价格影响因素传导分析方法,其特征在于,传导分析的结果以事件为节点,以事件之间的关系为边,存入图数据库中以实现可视化效果。7.一种金融产品价格影响因素传导分析系统,其特征在于,系统包括:预处理...

【专利技术属性】
技术研发人员:林越峰史光伟鲁继东高剑苗仲辰王晨宇江航倪梦珺杨熠
申请(专利权)人:上海金融期货信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1