The invention relates to a server, a text data processing method and a storage medium. The method includes: dividing various financial text data into corresponding text object types; analyzing financial text data of each text object type of each stock entity at each time point, and obtaining the evaluation level of each financial text data; The number of each evaluation grade of financial text data under each text object type is counted, and the proportion of each evaluation grade is calculated based on the number of each evaluation grade after statistics; the attribute score of each evaluation grade is obtained, and the entity of the stock is calculated according to the corresponding attribute score of each evaluation grade and the proportion of each evaluation grade. The market evaluation index of the stock entity at each time point is obtained, and the corresponding market evaluation index sequence of the stock entity is generated according to the time sequence of the market evaluation index at each time point. The invention can fully excavate financial text data and obtain accurate market information.
【技术实现步骤摘要】
服务器、文本数据的处理方法及存储介质
本专利技术涉及数据分析
,尤其涉及一种服务器、文本数据的处理方法及存储介质。
技术介绍
目前,在各个时间截面上,每一家上市公司都存在各种文本数据,例如业绩预报、融资报道、分析师预测、公司治理等,现有技术中一般仅仅简单分析单个的文本得出相应的市场评价,然而,由于这些文本数据中包含大量的市场信息,简单分析单个的文本无法充分挖掘得到准确的市场信息,无法对公司或行业进行有效的指导,因此对这些文本数据进行充分挖掘以得到准确的市场信息,成为有待解决的技术问题。
技术实现思路
本专利技术的目的在于提供一种服务器、文本数据的处理方法及存储介质,旨在充分挖掘金融文本数据得到准确的市场信息。为实现上述目的,本专利技术提供一种服务器,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股 ...
【技术保护点】
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。
【技术特征摘要】
1.一种服务器,其特征在于,所述服务器包括存储器及与所述存储器连接的处理器,所述存储器中存储有可在所述处理器上运行的处理系统,所述处理系统被所述处理器执行时实现如下步骤:按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业绩类型、融资类型、公司治理类型、分析师类型及其他类型;利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级;对各文本对象类型下的金融文本数据的各评价等级的数量进行统计,基于统计后的各评价等级的数量计算各评价等级的比重;获取各评价等级对应的属性分值,根据各评价等级对应的属性分值及各评价等级的比重计算该个股实体在该时间点的市场评价指数;获取该个股实体在每一时间点的市场评价指数,将每一时间点的市场评价指数按照时间先后顺序生成该个股实体对应的市场评价指数序列。2.根据权利要求1所述的服务器,其特征在于,所述评价等级包括第一等级、第二等级及第三等级,所述第一等级的属性分值为1,所述第二等级的属性分值为0,所述第三等级的属性分值为-1,所述市场评价指数=100*[第一等级的比重*1+第二等级的比重*0+第三等级的比重*(-1)]。3.根据权利要求1或2所述的服务器,其特征在于,所述利用预定的文本分析方法分析每一个股实体在每一时间点下的各文本对象类型的金融文本数据,得到各金融文本数据对应的评价等级的步骤,具体包括:利用预定的分词模型对每一金融文本数据进行分词,得到每一金融文本数据对应的分词;将每一金融文本数据对应的分词输入至预定的转换模型,获取输出的每一金融文本数据对应的词向量;将每一金融文本数据对应的词向量输入至预定的情感分析模型中,获取输出的该金融文本数据中每一语句的情感分析结果;统计该金融文本数据中各语句的情感分析结果,根据所统计的情感分析结果获取该金融文本数据对应的评价等级。4.根据权利要求1或2所述的服务器,其特征在于,所述处理系统被所述处理器执行时,还实现如下步骤:按照预定的行业分类方法将各个个股实体分至对应的行业类别,获取各个个股实体的最新总市值,根据各个个股实体的最新总市值计算各个行业类别对应的总市值;根据各个个股实体的最新总市值及该个股实体所属的行业类别对应的总市值计算该个股实体的市值比重;根据该个股实体在该时间点的市场评价指数及该市值比重计算该个股实体在该时间点的行业评价指数;获取该个股实体在每一时间点的行业评价指数,将每一时间点的行业评价指数按照时间先后顺序生成该个股实体对应的行业评价指数序列。5.一种文本数据的处理方法,其特征在于,所述文本数据的处理方法包括:S1,按照预设的分类规则将各种金融文本数据分为对应的文本对象类型,其中,文本对象类型包括业...
【专利技术属性】
技术研发人员:李海疆,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。