一种结合财经新闻的股市预测方法技术

技术编号:34836607 阅读:26 留言:0更新日期:2022-09-08 07:31
本发明专利技术公开了一种结合财经新闻的股市预测方法,包括以下步骤:1.设置关键词库,在金融关键词库设置同义词组;2.同义词组都设置有权重系数组合,权重系数组合分为权重系数k1,直至权重系数kn;3.接入财经新闻资讯;4.统计W1关键词及所有关键词出现的次数之和x;5.统计出统计单元里权重系数之和,其公式为:W1=k1+

【技术实现步骤摘要】
一种结合财经新闻的股市预测方法


[0001]本专利技术涉及数据处理
,特别涉及一种结合财经新闻的股市预测方法。

技术介绍

[0002]证券市场与金融投资在现代社会中占有重要的地位。股票市场的建模和预测研究对我国的经济发展和金融建设具有重要意义,一直为人们所关注,股市行情受国家政策、经济形势、公司发展状况以及投资者心理等诸多因素的影响。
[0003]随着互联网技术的迅速发展和广发普及,普通投资者有越来越多的渠道获得更多的互联网信息。越来越多的财经网站每天都会推送大量的有关于各个公司的财经新闻以及媒体或者专家对于各个公司近来状况的解读,所以投资者会受到来自各个方面新闻信息的影响,这些新闻信息会影响投资者的判断。现在人们的资产大多在股市里,如美国,人们的股票占其资产的三分之一强,股市的涨跌都牵动亿万群众的心,人们对股市都非常关心。
[0004]然而财经新闻的内容那么多,而且都是很有时效性,如不能及时得到消息,那么就会错过股市涨跌信息,使自己财产遭受损失。

技术实现思路

[0005]本专利技术要解决的技术问题是提供一种结合财经新闻的股市预测方法,解决通过获取财经新闻来预测股市涨跌的问题。
[0006]为了解决上述技术问题,本专利技术的技术方案为:一种结合财经新闻的股市预测方法,包括以下步骤:
[0007](一)设置金融关键词库,在金融关键词库设置所关注金融资讯的同义词组,同义词组设置有一个或多个关键词,所述关键词均标识为正面信息或负面信息;
[0008](二)将每个同义词组都设置有与其相匹配的权重系数组合,所述权重系数组合又分为同义词组里所述关键词出现第一次的权重系数k1,直至出现第n次的权重系数kn,n为大于1.5的自然数,kn=k1*2
n
‑1,所述k1小于kn,所述k1大于1.0,n为所述同义词组里所有关键词出现次数之和;
[0009](三)接入早七点至次日早一点之间的财经新闻资讯,将每天这个时间段视为一个统计单元;
[0010](四)按照关键词库里的同义词组里关键词逐一查找,统计所述统计单元里所出现正面信息的W1关键词及W1关键词所在同义词组里所有关键词出现的次数之和x,x为自然数;
[0011](五)统计出所述统计单元里所述W1关键词所在同义词组里所有关键词的权重系数之和,其公式为:Q1=k1*(21‑1+

+2
x
‑1),得出Q1,x为大于1.5的自然数,当x=1时Q1=k1;直至统计出所述统计单元里出现的正面信息的第y个Wy关键词的权重系数之和并得出Qy,y为大于1.5的自然数,当只有一个关键词时所述统计单元里所有关键词权重系数之和的乘积M=Q1;
[0012](六)统计出所述统计单元里所有正面信息的关键词权重系数之积M1=Q1

*

Qy,依此类推,统计出所述统计单元里所出现所有负面信息的关键词权重系数之积M2;
[0013](七)在凌晨两点之前将M1

M2=M0得出M0值以便留出时间为购买股票来筹集资金;当M0大于零时即预示股市即将上涨,且M0的值越大股市上涨的幅度也就越大;当M0小于零时即预示股市即将下跌,且M0的值越小股市下跌的幅度也就越大。
[0014]作为本专利技术的一种优选方案,所述金融关键词库的正面信息包括牛市、上市、多头市场、长多、死多、实多、多杀多、利多、反弹。
[0015]作为本专利技术的一种优选方案,所述金融关键词库的负面信息包括熊市、空头市场、长空、跳空、吊空、跌停板价、套牢、扎空、缺口、买空、卖空、利多、利空、洗盘、回档。
[0016]作为本专利技术的一种优选方案,所述M0值大于M10且小于M20时即认定为股市正常波动,所述M0值大于M20时股市全线飘红,所述M0值小于M10时股市全线飘绿。
[0017]采用本技术方案的有益效果:通过将关键词设置权重系数来确定与所关注金融资讯的关联远近,通过在一个资讯里所有关键词权重系数之积来确定该资讯与所关注金融资讯内容远近,通过将正面信息和负面信息相减对比来判断股票的涨跌,具有大数据综合分析的能力。
附图说明
[0018]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本专利技术的示意图。
具体实施方式
[0020]为进一步说明各实施例,本专利技术提供有附图,这些附图为本专利技术揭露内容的一部分,其主要用以说明实施例,并可配合说明书的相关描述来解释实施例的运作原理,配合参考这些内容,本领域普通技术人员应能理解其他可能的实施方式以及本专利技术的优点,图中的组件并未按比例绘制,而类似的组件符号通常用来表示类似的组件。
[0021]下面结合附图对本专利技术的具体实施方式作进一步说明。在此需要说明的是,对于这些实施方式的说明用于帮助理解本专利技术,但并不构成对本专利技术的限定。此外,下面所描述的本专利技术各个实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互组合。
[0022]参考附图,一种结合财经新闻的股市预测方法,包括以下步骤:
[0023](一)设置金融关键词库,在金融关键词库设置所关注金融资讯的同义词组,同义词组设置有一个或多个关键词,所述关键词均标识为正面信息或负面信息;如同义词组里美国、USA,也有人叫漂亮国,所以将美国、USA、漂亮国设置为一个同义词组,又如中国人民银行,有媒体称其为央妈,也有称为央行,那么中国人民银行、央妈、央行设置为一个同义词组;有些与金融不相关的词汇也列入这个关键词库里,如战争、疫情、地震、海啸等,这些词汇出现,就会使某些方面出现巨大需求,也会引起股市上涨。战争、疫情、地震、海啸,其中战争对股市影响有两面性,对战争所在地是负面影响,但是战争爆发时股市就休市了,战争对
其他地方的影响是正面的,因为创造出大量需求,股市会上涨,所以还是将战争列为正面信息。
[0024](二)将每个同义词组都设置有与其相匹配的权重系数组合,所述权重系数组合又分为同义词组里所述关键词出现第一次的权重系数k1,直至出现第n次的权重系数kn,n为大于1.5的自然数,kn=k1*2
n
‑1,所述k1小于kn,所述k1大于1.0,n为所述同义词组里所有关键词出现次数之和;也就说后面出现这个关键词,那么其权重系数就越来越大,越来越强,如W1关键词,其第一次出现时的权重系数为k1,第二次出现时的权重系数为k1*2,第三次出现时的权重系数为k1*4,直至出现第N次的权重系数k1*2
n
‑1;之所以要将后面出现的关键词的权重系数设置也越来越大,就是把在新闻里多次出现的关键词突出展现出来,多次出现的肯定非常重要,其系数也就越来越大;如第一次出现的权重系数为5.0,那么第二次本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合财经新闻的股市预测方法,其特征在于:包括以下步骤:(一)设置金融关键词库,在金融关键词库设置所关注金融资讯的同义词组,同义词组设置有一个或多个关键词,所述关键词均标识为正面信息或负面信息;(二)将每个同义词组都设置有与其相匹配的权重系数组合,所述权重系数组合又分为同义词组里所述关键词出现第一次的权重系数k1,直至出现第n次的权重系数kn,n为大于1.5的自然数,kn=k1*2
n
‑1,所述k1小于kn,所述k1大于1.0,n为所述同义词组里所有关键词出现次数之和;(三)接入早七点至次日早一点之间的财经新闻资讯,将每天这个时间段视为一个统计单元;(四)按照关键词库里的同义词组里关键词逐一查找,统计所述统计单元里所出现正面信息的W1关键词及W1关键词所在同义词组里所有关键词出现的次数之和x,x为自然数;(五)统计出所述统计单元里所述W1关键词所在同义词组里所有关键词的权重系数之和,其公式为:Q1=k1*(21‑1+

+2
x
‑1),得出Q1,x为大于1.5的自然数,当x=1时Q1=k1;直至统计出所述统计单元里出现的正面信息的第y个Wy关键词的权重系数之和并得出Qy...

【专利技术属性】
技术研发人员:陈守红
申请(专利权)人:深圳格隆汇信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1