一种基于混合注意力网络的事件检测方法及装置制造方法及图纸

技术编号：27222201 阅读：48 留言：0更新日期：2021-02-04 11:42

本发明专利技术一种基于混合注意力网络的事件检测方法及装置，所述方法包括：构建混合注意力网络模型，包括多语言表示层、混合注意力层和分类层；在所述的多语言表示层进行源文本的翻译以及多种语言的目标文本的获取，并且进行了文本的对齐，将多种语言的目标文本转化为句子序列的向量表示；混合注意力层，同时对多种语言的文本并行进行上下文注意力的学习，通过多语言注意力机制进行跨源语言和多种目标语言的信息融合；在分类层进行事件类型的预测分类。类。类。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于混合注意力网络的事件检测方法及装置

[0001]本专利技术涉及自然语言处理中的事件检测
，尤其涉及一种基于混合注意力网络的事件检测方法及装置。

技术介绍

[0002]事件检测任务就是从纯文本中识别出具有特定类型的事件实例。具体而言，给定一个输入文本，事件检测任务需要确定这个文本中包含的触发词以及触发词所描述的事件类型，它包含事件触发词识别和事件触发词分类两个子任务。举例来说，给定一个纯文本：Three elephants were shot dead。事件检测可以自动从文本中识别出触发词
ꢀ“
shot
”ꢀ
以及其触发的事件子类型 Attack （类型 Con
ﬂ
ict）和触发词
ꢀ“
dead
”ꢀ
以及其触发的事件子类型 Die（类型 Life）。
[0003]尽管当前事件检测问题的研究已经取得了比较大的进展，但是仍然存在两个问题会严重限制当前方法的性能。一是由于数据稀疏而导致的低召回率问题。在训练数据有限的情况下，有些事件类型的训练样例会尤其少，从这些极少的训练样例中学习出来的模型，要从某一事件类型的不同表达形式中识别出正确的事件类型是十分具有挑战性的。二是由于自然语言的歧义性而导致的低精确率。自然语言中存在着多义现象，很多事件触发词也是多义词。
[0004]模型 GMLATT 引入了一种门控双语言的框架，这个模型综合运用原本语言（源语言，source language）文本的信息和翻译过后的一种译...

【技术保护点】

【技术特征摘要】
1.一种基于混合注意力网络的事件检测方法，其特征在于，所述方法包括：步骤1，构建混合注意力网络模型，包括多语言表示层、混合注意力层和分类层；步骤2，在所述的多语言表示层进行源文本的翻译以及多种语言的目标文本的获取，并且进行了文本的对齐，将多种语言的文本转化为句子序列的向量表示；步骤3，在所述的混合注意力层，同时对多种语言的文本并行进行上下文注意力的学习，通过多语言注意力机制进行跨源语言和多种目标语言的信息融合；步骤4，将事件检测任务形式化为一个多类型分类问题，在分类层进行事件类型的预测分类；所述步骤2中多语言表示层输入的文本是单词序列文本，处理过程包括以下步骤：使用Google Translate来处理每一条输入的源语言文本，获得多种语言的并行目标语言文本；利用对齐工具 Giza++ 2来进行多种语言文本的对齐；在进行句子表示时，将每个输入分词转化为一个实值向量，这个向量包括以下三种特征表示的联结：1）词向量：词向量能够捕获文本中单词的语义信息，通常被用作各种任务的基本向量；2）实体类型向量：使用标注好的实体信息作为额外特征，随机初始化每个实体类型的向量并且在训练过程中不断更新，不同的语言共享实体向量表；3）位置向量：位置向量表示了上下文分词和当前分词之间的相对距离，它通过查找一个随机初始化的位置向量表获得；由此，输入的文本被转化为一个向量序列，其中，每一个向量都是上述三种特征向量的联结；采用双向门控循环单元分别用两个GRU层在前向和后向处理向量序列，前向GRU层的隐层向量编码从到的序列；相似地，反向GRU层的隐层向量编码从到的序列；然后前向隐层向量和反向隐层向量被联结以组成的向量表示，即；最后，输入序列的双向门控循环单元表示将作为整个句子的表示向量，源语言文本的向量表示为，第个目标语言文本的向量表示为，其中，和分别是文本的句长；所述步骤3中混合注意力层，顺序进行上下文注意力机制和多语言注意力机制来捕获多语言线索；所述的上下文注意力机制的目的是生成上下文向量，挖掘不同种语言的上下文提供的一致性信息，所述的上下文注意力机制会在每种语言上分别进行；给定源语言文本的表示，上下文注意力机制会计算一个上下文表示向量，用于表示源语言文本上下文的综合信息，即：
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（1）
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（2）,
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
（3）其中，是权重矩阵，是偏...

【专利技术属性】
技术研发人员：谭真，黄培馨，赵翔，方阳，徐浩，唐九阳，肖卫东，张鑫，
申请(专利权)人：中国人民解放军国防科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人