服务器、文本数据的处理方法及存储介质技术

技术编号:19344983 阅读:24 留言:0更新日期:2018-11-07 14:56
本发明专利技术涉及一种服务器、文本数据的处理方法及存储介质,该方法包括:将各种金融文本数据分为对应的文本对象类型;分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。本发明专利技术能够充分挖掘金融文本数据得到准确的市场信息。

Server, text data processing method and storage medium

The invention relates to a server, a text data processing method and a storage medium. The method includes: dividing various financial text data into corresponding text object types; analyzing financial text data of each text object type of each stock entity at each time point, and obtaining the evaluation level of each financial text data; The number of each evaluation grade of financial text data under each text object type is counted, and the proportion of each evaluation grade is calculated based on the number of each evaluation grade after statistics; the attribute score of each evaluation grade is obtained, and the entity of the stock is calculated according to the corresponding attribute score of each evaluation grade and the proportion of each evaluation grade. The market evaluation index of the stock entity at each time point is obtained, and the corresponding market evaluation index sequence of the stock entity is generated according to the time sequence of the market evaluation index at each time point. The invention can fully excavate financial text data and obtain accurate market information.

【技术实现步骤摘要】
服务器、文本数据的处理方法及存储介质
本专利技术涉及数据分析
,尤其涉及一种服务器、文本数据的处理方法及存储介质。
技术介绍
目前,在各个时间截面上,每一家上市公司都存在各种文本数据,例如业绩预报、融资报道、分析师预测、公司治理等,现有技术中一般仅仅简单分析单个的文本得出相应的市场评价,然而,由于这些文本数据中包含大量的市场信息,简单分析单个的文本无法充分挖掘得到准确的市场信息,无法对公司或行业进行有效的指导,因此对这些文本数据进行充分挖掘以得到准确的市场信息,成为有待解决的技术问题。
技术实现思路
本专利技术的目的在于提供一种服务器、文本数据的处理方法及存储介质,旨在充分挖掘金融文本数据得到准确的市场信息。为实现上述目的,本专利技术提供一种服务器,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。优选地,所述评价等级包括第一等级、第二等级及第三等级,所述第一等级的属性分值为1,所述第二等级的属性分值为0,所述第三等级的属性分值为-1,所述市场评价指数=100*[第一等级的比重*1+第二等级的比重*0+第三等级的比重*(-1)]。优选地,所述利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级的步骤,具体包括:利用预定的分词模型对每一金融文本数据进行分词,得到每一金融文本数据对应的分词;将每一金融文本数据对应的分词输入至预定的转换模型,获取输出的每一金融文本数据对应的词向量;将每一金融文本数据对应的词向量输入至预定的情感分析模型中,获取输出的该金融文本数据中每一语句的情感分析结果;统计该金融文本数据中各语句的情感分析结果,根据所统计的情感分析结果获取该金融文本数据对应的评价等级。优选地,所述处理系统被所述处理器执行时,还实现如下步骤:按照预定的行业分类方法将各个个股实体分至对应的行业类别,获取各个个股实体的最新总市值,根据各个个股实体的最新总市值计算各个行业类别对应的总市值;根据各个个股实体的最新总市值及该个股实体所属的行业类别对应的总市值计算该个股实体的市值比重;根据该个股实体在该时间点的市场评价指数及该市值比重计算该个股实体在该时间点的行业评价指数;获取该个股实体在每一时间点的行业评价指数,将每一时间点的行业评价指数按照时间先后顺序生成该个股实体对应的行业评价指数序列。为实现上述目的,本专利技术还提供一种文本数据的处理方法,所述文本数据的处理方法包括:S1,按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;S2,利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;S3,对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;S4,获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;S5,获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。优选地,所述评价等级包括第一等级、第二等级及第三等级,所述第一等级的属性分值为1,所述第二等级的属性分值为0,所述第三等级的属性分值为-1,所述市场评价指数=100*[第一等级的比重*1+第二等级的比重*0+第三等级的比重*(-1)]。优选地,所述步骤S2,具体包括:利用预定的分词模型对每一金融文本数据进行分词,得到每一金融文本数据对应的分词;将每一金融文本数据对应的分词输入至预定的转换模型,获取输出的每一金融文本数据对应的词向量;将每一金融文本数据对应的词向量输入至预定的情感分析模型中,获取输出的该金融文本数据中每一语句的情感分析结果;统计该金融文本数据中各语句的情感分析结果,根据所统计的情感分析结果获取该金融文本数据对应的评价等级。优选地,该文本数据的处理方法,还包括:按照预定的行业分类方法将各个个股实体分至对应的行业类别,获取各个个股实体的最新总市值,根据各个个股实体的最新总市值计算各个行业类别对应的总市值;根据各个个股实体的最新总市值及该个股实体所属的行业类别对应的总市值计算该个股实体的市值比重;所述步骤S4之后,还包括:根据该个股实体在该时间点的市场评价指数及该市值比重计算该个股实体在该时间点的行业评价指数;获取该个股实体在每一时间点的行业评价指数,将每一时间点的行业评价指数按照时间先后顺序生成该个股实体对应的行业评价指数序列。优选地,该文本数据的处理方法,还包括:将属于同一行业类别的个股实体在同一时间点的行业评价指数相加得到该行业类别在该时间点的市场指数;获取该行业类别在每一时间点的市场指数,将每一时间点的市场指数按照时间先后顺序生成该行业类别对应的市场指数序列。本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有处理系统,所述处理系统被处理器执行时实现上述的文本数据的处理方法的步骤。本专利技术的有益效果是:本专利技术对各个股实体在每一时间截面的不同的文本对象类型的金融文本数据,利用预定的文本分析方法进行分析,得出每一金融文本数据的评价,对各文本对象类型下的金融文本数据的各评价等级的数量进行统计并计算各评价等级的比重,根据各评价等级的属性分值及比重计算该个股实体在该时间点的市场评价指数,根据该市场评价指数可以得出市场对该公司在该时间点的评价,本专利技术对将金融文本数据分为不同的文本对象类型并采用预定的文本分析方法进行分析的方式,能够充分挖掘得到准确的市场信息,按照时间顺序生成市场评价指数序列,可以得出市场对该公司的评价的变化及趋势,供进行市场分析附图说明图1为本专利技术服务器一实施例的硬件架构的示意图;图2为本专利技术文本数据的处理方法第一实施例的流程示意图;图3为图2所示步骤S2的细化流程示意图;图4为本专利技术文本数据的处理方法第二实施例的流程示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、本文档来自技高网...

【技术保护点】
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。

【技术特征摘要】
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。2.根据权利要求1所述的服务器,其特征在于,所述评价等级包括第一等级、第二等级及第三等级,所述第一等级的属性分值为1,所述第二等级的属性分值为0,所述第三等级的属性分值为-1,所述市场评价指数=100*[第一等级的比重*1+第二等级的比重*0+第三等级的比重*(-1)]。3.根据权利要求1或2所述的服务器,其特征在于,所述利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级的步骤,具体包括:利用预定的分词模型对每一金融文本数据进行分词,得到每一金融文本数据对应的分词;将每一金融文本数据对应的分词输入至预定的转换模型,获取输出的每一金融文本数据对应的词向量;将每一金融文本数据对应的词向量输入至预定的情感分析模型中,获取输出的该金融文本数据中每一语句的情感分析结果;统计该金融文本数据中各语句的情感分析结果,根据所统计的情感分析结果获取该金融文本数据对应的评价等级。4.根据权利要求1或2所述的服务器,其特征在于,所述处理系统被所述处理器执行时,还实现如下步骤:按照预定的行业分类方法将各个个股实体分至对应的行业类别,获取各个个股实体的最新总市值,根据各个个股实体的最新总市值计算各个行业类别对应的总市值;根据各个个股实体的最新总市值及该个股实体所属的行业类别对应的总市值计算该个股实体的市值比重;根据该个股实体在该时间点的市场评价指数及该市值比重计算该个股实体在该时间点的行业评价指数;获取该个股实体在每一时间点的行业评价指数,将每一时间点的行业评价指数按照时间先后顺序生成该个股实体对应的行业评价指数序列。5.一种文本数据的处理方法,其特征在于,所述文本数据的处理方法包括:S1,按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业...

【专利技术属性】
技术研发人员:李海疆
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1