一种基于信号衰减的企业业绩预测指标筛选方法及系统技术方案

技术编号:29967529 阅读:22 留言:0更新日期:2021-09-08 09:38
本发明专利技术提供一种基于信号衰减的企业业绩预测指标筛选方法,通过对获取的目标企业的研报图表中的文本数据信号做衰减处理,对发布时间最新的文本,应当给予更高的权重,而离当前时点越远的文本数据信号,应给予更低的权重,这样保证了根据逻辑关联程度评判指标具有时效性,进一步地,保证筛选出来的先行指标更具预测应用价值。预测应用价值。预测应用价值。

【技术实现步骤摘要】
一种基于信号衰减的企业业绩预测指标筛选方法及系统


[0001]本专利技术涉及指标筛选
,尤其涉及一种基于信号衰减的企业业绩预测指标筛选方法及系统。

技术介绍

[0002]随着时间推移和上市公司经营范围的变化,上市公司经营业绩的先行指标也会发生变化,而市场上可以采购到的指标的数量数量级庞大(几十万条,甚至上百万条)。因此,在从数量庞大的指标中,筛选先行指标时,应该保证筛选出的指标的时效性,这样才能保证筛选出来的线性指标根据有预测应用价值。

技术实现思路

[0003]有鉴于此,本申请实施例提供了一种基于信号衰减的企业业绩预测指标筛选方法及系统。
[0004]第一方面,本申请实施例提供了一种基于信号衰减的企业业绩预测指标筛选方法,其特征在于,包括:
[0005]获取目标企业的相关研报图表和营业收入,并从所述研报图表中获取直接关键词和所述研报图表的年份信息;
[0006]对所述直接关键词进行扩展,得到候选关键词;根据所述候选关键词和所述研报图表的年份信息,得到信号衰减词频;
[0007]将所述信号衰减词频与词频阈值进行比较得到关键词列表;根据所述关键词列表对所述目标企业所述的行业数据库中的指标进行筛选,获取关键指标列表,并获取所述关键指标列表中的各指标的指标值;
[0008]确定所述营业收入和所述各指标的指标值的相关性,根据所述相关性,获取相关指标列表;
[0009]对相关指标列表中的指标进行去共线性,获得前瞻指标。
[0010]可选地,所述从所述研报图表中获取直接关键词包括:
[0011]通过字符识别技术得到所述研报图表中的文字信息;
[0012]针对所述研报图表中的文字信息,通过分词、词频统计和词性分析得到所述研报图表中的关键词。
[0013]可选地,其特征在于,所述对所述直接关键词进行扩展,得到候选关键词包括:
[0014]获取所述直接关键词的同义词,将所述同义词和所述直接关键词作为后选关键词。
[0015]可选地,其特征在于,所述根据所述候选关键词和所述研报的年份信息,得到信号衰减词频包括:
[0016]统计不同年份的研报图表中的关键词的词频,并将不同年份的词频通过加权求和得到信号衰减词频。
[0017]可选地,所述将不同年份的词频通过加权求和得到信号衰减词频包括:距离当前年份越近的年份对应的词频具有的权重越高。
[0018]可选地,所述根据所述关键词列表对与所述目标企业相关的指标进行筛选,获取指标列表包括:将关键词列表中的关键词与所述指标进行模糊匹配,并将匹配成功的指标确定为关键指标,并生成关键指标列表。
[0019]第二方面,本申请实施例提供了一种基于信号衰减的企业业绩预测指标筛选系统,包括:
[0020]采集单元,用于采集目标企业的相关研报图表和营业收入;
[0021]处理单元,用于从所述研报图表中获取直接关键词和所述研报图表的年份信息,并对所述直接关键词进行扩展,得到候选关键词,根据所述候选关键词和所述研报图表的年份信息,得到信号衰减词频;将所述信号衰减词频与词频阈值进行比较得到关键词列表;根据所述关键词列表对所述目标企业所属的行业数据库中的指标进行筛选,获取关键指标列表,并获取所述关键指标列表中的各指标的指标值;确定所述营业收入和所述各指标的指标值的相关性,根据所述相关性,获取相关指标列表;对相关指标列表中的指标进行去共线性,获得前瞻指标。
[0022]本申请实施例提供一种基于信号衰减的企业业绩预测指标筛选方法及系统,通过基于信号衰减的词频计算,可以得到对应的关键词列表,关键词在列表中的位置反应了该关键词的重要程度,通过关键词和宏观指标与产业指标的模糊匹配,得到企业对应的宏观指标和产业指标列表。然后根据目标企业的宏观指标和产业指标的指标值与营业收入的相关新确定目标企业前瞻指标。该前瞻性指标具有更高的时效性和更优的预测应用价值。
附图说明
[0023]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0024]图1为本申请实施例提供的一种基于信号衰减的企业业绩预测指标筛选系统的结构示意图;
[0025]图2本专利技术申请实施例提供的一种基于信号衰减的企业业绩预测指标筛选方法的流程图;
[0026]图3为本申请实施例提供的又一种基于信号衰减的企业业绩预测指标筛选方法的流程图;
[0027]图4为通过信号衰减词频得到的关键词及其对应的宏观指标和产业指标的结果示意图;
[0028]图5为通过信号衰减词频得到的关键词及其对应的宏观指标和产业指标经过去共线性得到的前瞻因子的结果示意图。
具体实施方式
[0029]下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。
[0030]用于评判宏观、行业数据指标与上市公司经营业绩之间逻辑关联程度的评判指标的构建,需要对文本数据信号做衰减处理,发布时间最新的文本,应当给予更高的权重,而离当前时点越远的文本数据,应该给予更低的权重,这样才能保证逻辑关联程度评判指标具有时效性,保证筛选出来的先行指标更具预测应用价值。
[0031]因此,本专利技术申请实施例提供了一种基于信号衰减的企业业绩预测指标筛选系统,如图1所示,包括:采集单元101、处理单元102、存储单元103、显示单元104。这些元件可以连接到内部总线,也可以通过单独的布线彼此连接。
[0032]采集单元101用于采集目标企业的研报图表和营业收入。并将采集到的研报图表和营业收入信息存入到存储单元103中。
[0033]处理单元102用于从采集单元101采集的研报图表中获取直接关键词,和各直接关键词所对应的研报的年份信息。然后对获取的直接关键词进行扩展,得到候选关键词,并根据候选关键词以及该关键词对应的研报的年份信息得到信号衰减词频。进一步地,将信号衰减词频与预先设置的词频阈值进行比价得到关键词列表,根据关键词列表对目标企业所属的行业数据库中的指标进行筛选,获取指标列表,并计算该指标列表中的各指标的指标值,然后再计算获取的目标企业的营业收入与指标列表中各指标值的相关性,根据该相关性,获得可以预测企业业绩的前瞻性指标。
[0034]存储单元103用于对采集单元101采集的目标企业的研报图表和营业收入进行存储。进一步地,存储单元103还用于对处理单元102确定出的前瞻性指标进行存储。
[0035]在一个可能的示例中,采集单元101在采集完目标企业的研报图表和营业收入以后,可以将该研报图表和营业收入直接发送给处理单元102进行处理,无需在存入到存储单元103中。
[0036]显示单元104用于获得的前瞻性指标进行显示。
[0037]显示单元104还用于接收用户输入的企业名称信息,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于信号衰减的企业业绩预测指标筛选方法,其特征在于,包括:获取目标企业的相关研报图表和营业收入,并从所述研报图表中获取直接关键词和所述研报图表的年份信息;对所述直接关键词进行扩展,得到候选关键词;根据所述候选关键词和所述研报图表的年份信息,得到信号衰减词频;将所述信号衰减词频与词频阈值进行比较得到关键词列表;根据所述关键词列表对所述目标企业所述的行业数据库中的指标进行筛选,获取关键指标列表,并获取所述关键指标列表中的各指标的指标值;确定所述营业收入和所述各指标的指标值的相关性,根据所述相关性,获取相关指标列表;对相关指标列表中的指标进行去共线性,获得前瞻指标。2.根据权利要求1所述的方法,其特征在于,所述从所述研报图表中获取直接关键词包括:通过字符识别技术得到所述研报图表中的文字信息;针对所述研报图表中的文字信息,通过分词、词频统计和词性分析得到所述研报图表中的关键词。3.根据权利要求1或2所述的方法,其特征在于,所述对所述直接关键词进行扩展,得到候选关键词包括:获取所述直接关键词的同义词,将所述同义词和所述直接关键词作为后选关键词。4.根据权利要求1所述的方法,其特征在于,所述根据所述候选关键词和所述研报的年份信息,得到信号衰减词频包括:...

【专利技术属性】
技术研发人员:周纯葆王彦棡王珏
申请(专利权)人:中国科学院计算机网络信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1