【技术实现步骤摘要】
数据处理方法、装置和计算机可读存储介质
本公开涉及数据处理
,特别涉及一种数据处理方法、数据处理装置和计算机可读存储介质。
技术介绍
在价值投资成为股票市场主流的背景下,准确预测公司营业收入成为投资制胜的重要法宝。营业收入是企业在生产经营活动中,因销售产品或提供劳务而取得的各项收入。营业收入关系到企业的生存和发展,对企业有重要的意义。买入盈利超预期的公司,避开盈利能力差的公司,就能获得超额收益。在相关技术中,根据财务报表数据,利用计量经济学中的时间序列模型对进行营业收入预测。
技术实现思路
本公开的专利技术人发现上述相关技术中存在如下问题:预测收益的相关数据和预测模型无法适应不同企业的实际情况,导致估计准确性低。鉴于此,本公开提出了一种数据处理技术方案,能够提高估计准确性。根据本公开的一些实施例,提供了一种数据处理方法,包括:选取影响企业的收益的多项相关数据;获取各相关数据对于所述收益的相关系数;判断是否存在大于第一阈值的相关系数;在存在大于第一阈值的相关系数的情况下,根据集成学习模型来估计所述企业的未来收益;在不存在大于第一阈值的相关系数的情况下,根据时间序列模型来估计所述未来收益。在一些实施例中,所述数据处理方法还包括:在不存在大于第一阈值的相关系数的情况下,判断所述企业的历史收益是否为平稳时间序列;在历史收益为平稳时间序列的情况下,根据时间序列模型来估计所述未来收益;在历史收益不为平稳时间序列的情况下,采用所述历史收益的均值来估计所述未来收益。在 ...
【技术保护点】
1.一种数据处理方法,包括:/n选取影响企业的收益的多项相关数据;/n获取各相关数据对于所述收益的相关系数;/n判断是否存在大于第一阈值的相关系数;/n在存在大于第一阈值的相关系数的情况下,根据集成学习模型来估计所述企业的未来收益;/n在不存在大于第一阈值的相关系数的情况下,根据时间序列模型来估计所述未来收益。/n
【技术特征摘要】
1.一种数据处理方法,包括:
选取影响企业的收益的多项相关数据;
获取各相关数据对于所述收益的相关系数;
判断是否存在大于第一阈值的相关系数;
在存在大于第一阈值的相关系数的情况下,根据集成学习模型来估计所述企业的未来收益;
在不存在大于第一阈值的相关系数的情况下,根据时间序列模型来估计所述未来收益。
2.根据权利要求1所述的数据处理方法,还包括:
在不存在大于第一阈值的相关系数的情况下,判断所述企业的历史收益是否为平稳时间序列;
在历史收益为平稳时间序列的情况下,根据时间序列模型来估计所述未来收益;
在历史收益不为平稳时间序列的情况下,采用所述历史收益的均值来估计所述未来收益。
3.根据权利要求2所述的数据处理方法,其中,所述判断所述企业的历史收益是否为平稳时间序列包括:
进行平稳性检验和白噪声检验中的至少一项,以判断所述历史收益是否为平稳时间序列。
4.根据权利要求1-3任一项所述的数据处理方法,还包括:
根据各相关数据之间的相关程度和所述各相关数据对所述收益的重要程度中的至少一项选取输入数据;
利用所述输入数据训练所述集成学习模型和估计所述企业的未来收益。
5.根据权利要求4所述的数据处理方法,其中,根据各相关数据之间的相关程度选取输入数据包括:
获取所述各相关数据之间的相关系数;
在两个相关数据之间的相关系数大于第二阈值的情况下,选取所述两个相关数据中的一个作为所述输入数据;
在两个相关数据之间的相关系数不大于所述第二阈值的情况下,选取所述两个相关数据作为所述输入数据。
6.根据权利要求4所述的数据处理方法,其中,根据各相关数据对所述收益的重要程度选取输入数据包括:
对所述集成学习模型进行预训练,以获取所述各相关数据对于所述未来收益的权值;
选取所述权值大于第三阈值的相关数据作为所述输入数据。
7.根据权利要求1-3任一项所述的数据处理方法,还包括:
按照收益规模将各企业划分到相应的企业组;
根据划分情况,训练各企业组相应的所述时间序列模型或所述集成学习模型;
根据企业所在的企业组,选取相应的所述时间序列模型或所述集成学习模型估计该企业的所述未来收益。
8.根据权利要求1-3任一项所述的数据处理方法,其中,
所述相关数据包括当前时间数据、所述企业的历史财务数据、所述企业的行业态势数据、所述企业的股票行情数据、所述企业的经营数据、宏观数据中的多项。
9.一种数据处理装置,包括:
选取单元,用于选取影响企业的收益的多项相关数据;
获取单元,用于获取各相关数据对于所述收益的相关系数;
判断单元,用于判断是否存在大于第一阈值的相关系数;
...
【专利技术属性】
技术研发人员:徐啸天,龚杰,于建明,
申请(专利权)人:京东数字科技控股有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。