一种基于舆论数据的股票异动分析方法技术

技术编号：18554890 阅读：103 留言：0更新日期：2018-07-28 11:33

本发明专利技术公开了一种基于舆论数据的股票异动分析方法，其建立了一套文本情感分析的模型，通过自然语言处理技术，提取海量的舆论数据的特征，挖掘出与特定的股票异常波动类型的特征，帮助领域专家和数据分析师分析股票的行情，帮助投资者获取关键信息，改善投资策略，并给定通用的方法，大大提高金融文本数据分析的效率，符合领域专家及投资者的需要。此外，本发明专利技术对于不同的股票异动结果类型均适用，能够指导领域专家对舆论的情感特征进行提取，给出情感分析所需要的数据及信息，使得领域专家在股票异动检测的工作中尽量发挥其领域知识方面的优势，更加全面准确地掌握有效信息，有助于改善投资策略。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于舆论数据的股票异动分析方法
本专利技术属于自然语言处理及数据挖掘
，具体涉及一种基于舆论数据的股票异动分析方法。
技术介绍
随着互联网技术的飞速发展，信息化与金融行业的深度融合，专家和权威机构在互联网上发布的海量有价值的评论、重要金融事件的报道和公司披露等，已成为领域专家和投资者了解金融市场的重要的信息来源。然而，与股票行情走势和投资相关性较强的关键信息被隐藏在庞大的文本中，另人眼花缭乱，不能及时地获取有效信息。行为经济学表明情绪会深刻地影响个人的行为和决策，这是否也适用于股票行业，即股民的情绪状态可能对其交易行为产生影响；股民的情感信息是否与股票的行情走势相关，甚至能否基于异常波动趋势之前的相关文本内容预测股票的异常波动？因此，基于趋势之前的舆论数据对股票异常波动进行分析具有相当重要的价值意义。现阶段的金融数据分析，主要是金融专家基于相关的理论基础，对于海量的金融信息报道，结合国家的宏观经济政策、投资环境与理念、上市公司及其产品服务等因素，对股市的行情进行全面的分析，对股市可能发生的异常波动作出分析和预警。但由于股票相关文本的数量庞大、实时性强，人工逐条阅读分析需要消耗巨大的人力资源，需要金融分析人员长时间、高频率地进行文本阅读，不仅效率低下，而且由于工作状态、个体情绪等人为因素，会对异动分析的准确度造成影响。显然，如果能够对股票文本的情感特征进行自动提取，挖掘情感特征与股票异常波动的关系，无疑将会对证券行业和股民的投资行为给予非常有意义的帮助。
技术实现思路
鉴于上述，本专利技术提供了一种基于舆论数据的股票异动分析方法，其建立了一套文本情感分...

【技术保护点】
1.一种基于舆论数据的股票异动分析方法，包括如下步骤：(1)对舆论数据进行采集并通过预处理得到多个样本集，所述样本集为固定时间段内关于股票的所有文章及其评论集合，其中的样本即为关于任一股票的一篇文章及其评论；(2)根据股票龙虎榜中的股票异动类型对样本进行类别标注，并将具有类别标注信息的样本分为训练集、验证集和测试集；(3)获取金融领域词典、情感词典以及程度副词词典，根据上述词典或通过word2vec方法对样本进行分词，即将样本中的每个词转换成词向量形式，从而得到每个句子由词向量所组成的词向量矩阵；(4)将一个样本中长度不同的句子所对应的词向量矩阵统一转换成固定维度大小的特征向量，进而将所有句子对应的特征向量合并后作为样本的特征向量；(5)将同一天内关于同一股票的所有样本的特征向量级联拼接成一个特征向量X，进而将所有特征向量X输入至CNN中，CNN的输出为对应一个日期戳的特征向量Y；(6)对于任一发生异动的股票，将该股票异动发生前一定时间段内的所有特征向量Y级联拼接成一个特征向量Z，进而将所有特征向量Z输入至LSTM中，LSTM的输出为对应一种异动类型的特征向量W；(7)将特征向量W、关...

【技术特征摘要】
1.一种基于舆论数据的股票异动分析方法，包括如下步骤：(1)对舆论数据进行采集并通过预处理得到多个样本集，所述样本集为固定时间段内关于股票的所有文章及其评论集合，其中的样本即为关于任一股票的一篇文章及其评论；(2)根据股票龙虎榜中的股票异动类型对样本进行类别标注，并将具有类别标注信息的样本分为训练集、验证集和测试集；(3)获取金融领域词典、情感词典以及程度副词词典，根据上述词典或通过word2vec方法对样本进行分词，即将样本中的每个词转换成词向量形式，从而得到每个句子由词向量所组成的词向量矩阵；(4)将一个样本中长度不同的句子所对应的词向量矩阵统一转换成固定维度大小的特征向量，进而将所有句子对应的特征向量合并后作为样本的特征向量；(5)将同一天内关于同一股票的所有样本的特征向量级联拼接成一个特征向量X，进而将所有特征向量X输入至CNN中，CNN的输出为对应一个日期戳的特征向量Y；(6)对于任一发生异动的股票，将该股票异动发生前一定时间段内的所有特征向量Y级联拼接成一个特征向量Z，进而将所有特征向量Z输入至LSTM中，LSTM的输出为对应一种异动类型的特征向量W；(7)将特征向量W、关于单股发帖量的特征信息以及大盘发帖量的变化特征信息共同输入至SVM中进行训练，得到用于股票异动分析的模型，进而利用该模型对股票异动提前做出分析预判。2.根据权利要求1所述的股票异动分析方法，其特征在于：...

【专利技术属性】
技术研发人员：罗智凌，靳婷，李莹，尹建伟，邓水光，吴朝晖，
申请(专利权)人：浙江大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人