一种基于层级多标签分类的金融事件检测方法、设备技术

技术编号：28978638 阅读：42 留言：0更新日期：2021-06-23 09:24

本发明专利技术提供了一种基于层级多标签分类的金融事件检测方法，包括以下步骤：步骤1：设计层级标签体系；步骤2：金融语料的收集与处理；步骤3:构建训练集和测试集；步骤4：表征模型预训练；步骤5：表征模型微调训练；步骤6：文本特征提取并分类；步骤7：事件预测。将本发明专利技术的实验结果与主流的基准模型进行对比，可以发现本发明专利技术的实验结果比基准模型的结果都好，无论是否有递归正则的约束。从准确度出发，本发明专利技术的模型完全预测正确的为57.42％，比最好的基准模型HAN要高出4％。从模型对父子节点的整体依赖角度来看，在HMDScore指标上本发明专利技术的模型比最好的HAN‑HR要高出近7个百分点。在层级文本分类的常用评测指标中hF‑score中，本发明专利技术的模型比最好的HAN‑HR高出近8个百分点。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于层级多标签分类的金融事件检测方法、设备
本专利技术涉及自然语言处理
，是一个基于层级多标签文本分类技术的对非结构性文本进行自动事件检测的方法、设备。
技术介绍
股票交易是一种与投资和融资有关的重要金融活动，许多交易者和机构作为投资者参与股票交易市场，买卖股票以获取利润。上市公司的股价通常受与这些公司有关的几个关键驱动因素的支持，例如销量，季度/年度收入，毛利润率，净收入和每股收益等。这些关键驱动因素通常受到各种因素的影响。比如政治，政策和宏观经济等因素，以及这些因素的变化最终将导致支撑股价的主要驱动力发生变化。影响关键驱动因素的状态变化通常以非结构性文本(例如新闻文章和政策声明)的形式呈现，而因素的状态变化被视为最终会影响上市公司股价的事件。因此如何准确精细地检测事件，是确保投资策略可靠有效的关键所在。在实际的应用场景中，往往以层级结构来表示和组织金融事件体系。面对具体的非结构性文本比如金融新闻或证券公司发布的研报，每条文本可能蕴含一个角度或多个角度，因此可以为该事件分配一个或多个事件标签，来表明去对应的层次结构和类别。因此可以将金融事件检测建模为层级多标签分类的问题。目前业界对层级多标签文本分类任务提出了许多方法，包括基于规则的方法、机器学习方法以及近年来得到长足发展的深度学习方法。基于规则的方法使用一组预定义的规则将文本分类为不同的类别。例如，任何带有“足球”，“篮球”或“棒球”字样的文档都被赋予“运动”标签。这些方法需要对领域有深入的了解，并且系统难以维护。传统的机器学习分类方法将...

【技术保护点】
1.一种基于层级多标签分类的金融事件检测方法，其特征在于，包括以下步骤：/n步骤1：设计层级标签体系；/n步骤2：收集金融语料，对收集到的语料进行文本预处理；/n步骤3：构建训练集和测试集；/n步骤4：使用步骤2中处理后的通用语料，基于双向Trasnformer模型进行表征模型预训练；/n步骤5：使用步骤3构建的数据集重点训练编码网络的最后一层；/n步骤6：文本特征提取并分类；/n步骤7：将目标文本输入编码网络，以概率分布的形式输出标签向量，最后通过训练得到的标签阈值作为判别标准，大于该阈值的视为将该标签分配给该文本，反之则不将标签分配给该文本。/n

【技术特征摘要】
1.一种基于层级多标签分类的金融事件检测方法，其特征在于，包括以下步骤：
步骤1：设计层级标签体系；
步骤2：收集金融语料，对收集到的语料进行文本预处理；
步骤3：构建训练集和测试集；
步骤4：使用步骤2中处理后的通用语料，基于双向Trasnformer模型进行表征模型预训练；
步骤5：使用步骤3构建的数据集重点训练编码网络的最后一层；
步骤6：文本特征提取并分类；
步骤7：将目标文本输入编码网络，以概率分布的形式输出标签向量，最后通过训练得到的标签阈值作为判别标准，大于该阈值的视为将该标签分配给该文本，反之则不将标签分配给该文本。

2.如权利要求1所述的基于层级多标签分类的金融事件检测方法，其特征在于，步骤1中，根据实际应用情况设计出一系列事件标签，并按照事件的蕴含关系构成树形结构的层级标签。

3.如权利要求1所述的基于层级多标签分类的金融事件检测方法，其特征在于，步骤2中，收集包括财经新闻、投研报告和上市公司年报季报在内的金融语料，对收集到的语料进行文本预处理，包括中文分词、去停词以及处理文本噪音。

4.如权利要求1所述的基于层级多标签分类的金融事件检测方法，其特征在于，步骤3中，对语料进行标注，然后对文本进行更进一步的筛选，保证标注结果准确全面，最后依据结果分别构建训练集、验证集和测试集。

5.如权利要求1所述的基于层级多标签分类的金融事件检测方法，其特征在于，步骤4中，所述基于双向Trasnformer模型为基于Transformer结构构建的编码网络：
所述编码网络包括12个编码层，每个编码层包括多个Transformer单元；所述Transformer的Encoder部分包括多头注意力机制和按位全联接前馈神经网络，对该两个子层的输出Sublayer(x)和原输入x求和后使用层级正则化，即LayerNorm(x+Sublayer(x))；
多头注意力机制：设输入为X＝(x1，x2，…，xn)，输出用MultiHead(X)表示，公式如下：

MultiHead(X)＝Concat(head1，head2，…，headh)Wo

为权重矩阵，dmodel，dX，分别为输入向量维度和子空间维度；Attention，表示自注意力机制，headi表示第i个子空间，Concat表示合并操作；
所述自注意力机制，公式如下：

其中，dk为输入...

【专利技术属性】
技术研发人员：梁鑫，程大伟，杨芳洲，罗轶凤，钱卫宁，周傲英，
申请(专利权)人：华东师范大学，上海瞰点科技有限责任公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人