基于显式事件结构知识增强的事件检测方法及终端设备技术

技术编号:29254226 阅读:12 留言:0更新日期:2021-07-13 17:24
本发明专利技术提供一种基于显式事件结构知识增强的事件检测方法,包括如下步骤:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;将事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,从而确定所述输入句子对应的事件类型。本发明专利技术提升了歧义触发词和生僻触发词的检测准确率和召回率,从而提升事件触发词的检测效果。

【技术实现步骤摘要】
基于显式事件结构知识增强的事件检测方法及终端设备
本专利技术涉及自然语言处理
,尤其是涉及基于显式事件结构知识增强的事件检测方法。
技术介绍
事件检测旨在从非结构化的文本中识别特定类型的事件,但现有的事件检测任务中对于带有歧义的触发词和生僻触发词存在检测效率低下的问题,事件检测中的歧义触发词和生僻触发词示例如图1所示。由于自然语言自身带有一定的多样性和歧义性,相同的事件触发词可能会根据上下文语境的不同从而代表不同的事件类别。在没有其他额外的知识或信息作为参考的情况下,歧义触发词可能会导致事件检测系统错误地对触发词的事件类别进行标记。现有技术为解决歧义触发词的问题,通常对上下文中其他事件元素的信息进行学习,而并没有对事件自身的结构知识进行探索与利用。对事件检测任务来说,识别生僻触发词等未在训练数据集中出现过的事件触发词同样也是一项艰巨的挑战。现有的事件检测模型通常通过学习同种事件类型下其他事件触发词的通用知识来检测生僻触发词。因此,如何从其他事件中选择更合适的通用知识,并采用全方位的事件结构知识来增强生僻触发词的向量表示仍然值得探索。
技术实现思路
本专利技术的目的在于提供一种基于显式事件结构知识增强的事件检测方法,以解决歧义触发词和生僻触发词检测准确率和召回率低的技术问题。为实现上述目的,本专利技术采用下述技术方案:一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;S2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;S3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;S4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型。在一些实施例中,所述事件背景知识图的构建步骤包括:S1.1:将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点,将事件触发词和事件论元角色的注释标签作为知识节点;S1.2:将各文本节点和知识节点分别进行连接,分别对事件触发词、事件论元和事件注释之间的关系,文本之间的关系,事件中的核心元素之间的关系,进行事件检测模型的构建;在一些实施例中,各文本节点和知识节点的连接方式包括:根据事件结构将对应的文本节点与知识节点进行纵向连接;将事件触发词的文本节点与事件论元的文本节点进行文本横向连接;将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行知识横向连接。在一些实施例中,所述动态知识匹配的步骤包括:S2.1:将所述事件背景知识图中事件触发词相关的背景知识与所述输入句子中的潜在事件触发词进行匹配;计算所述潜在事件触发词与所述事件背景知识图中事件触发词文本节点之间的事件触发词语义相似度得分;S2.2:选择所述事件触发词语义相似度得分最高的前k个潜在事件触发词作为候选事件触发词,并将所述候选事件触发词的文本节点所匹配的知识节点的事件类型作为输入句子的候选事件类型;S2.3:将输入句子中的潜在事件论元与所述事件背景知识图中的事件论元文本节点进行匹配;计算出所述潜在事件论元与所述事件背景知识图中事件论元文本节点之间的事件论元语义相似度得分;S2.4:选择所述事件论元语义相似度得分得分最高的前k个潜在事件论元,基于所述步骤S2.2获得的所述候选事件类型,选择属于所述候选事件类型的事件论元角色作为输入句子中所述事件论元的知识节点;S2.5:采用所述步骤S1.1-S1.3的方法构建所述输入句子的子图。在一些实施例中,所述事件触发词语义相似度得分的计算公式为:simtrg(wti,tnj)=cosine(E(wti),E(tnj))其中,wti表示输入句子中的一个潜在事件触发词,tnj表示事件背景知识图中存在的与潜在事件触发词相同的事件触发词文本节点,cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入;当所述潜在事件触发词未存在于所述事件背景知识图中时,所述事件触发词语义相似度得分的计算公式为:simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn))其中α是人工设置的可调权重,st和stn是输入句子中词语的ELMO嵌入的平均值;在一些实施例中,所述事件论元语义相似度得分的计算公式为:simarg(ek,enq)=cosine(E(ak),E(anq))其中,E(qnq)=[E(tnj),E(enq)]上述公式中,E(wti)表示输入句子中的候选事件触发词wti的词嵌入,E(ek)表示实体ek的词嵌入,E(ak)表示输入句子中的潜在事件论元,E(tnj)表示获得的候选事件触发词文本节点的嵌入,E(enq)表示同一事件类型中的论元角色文本节点enq的嵌入,E(anq)表示事件背景知识图中的事件论元。在一些实施例中,其特征在于,对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示的步骤包括:S3.1:将事件背景知识图中的每个事件中的事件触发词和事件论元角色的知识节点之间的连接作为所述每个事件的事件结构模式,预先设置一个次数作为阈值,再统计事件背景知识图中的所有事件结构模式,将同一事件中出现次数超过所述阈值的事件结构模式判定为高频事件结构模式;S3.2:通过事件选择路径机制对所述子图进行过滤;S3.3:通过文本编码器对所述子图中的文本节点进行编码;通过知识编码器对所述子图中的知识节点进行编码;S3.4:通过对所述边添加权重门来进一步更新边的权重并进行学习;再将所述子图的节点编码与边的权重输入多层图卷积神经网络,通过图卷积计算得到所述输入句子的图嵌入并进行学习,得到包含事件结构的知识的信息的图表示。在一些实施例中,通过事件选择路径机制对所述子图进行过滤的方式为:当所述输入句子的子图中的候选事件的事件结构模式属于高频事件结构模式时,则保留所述子图中的所述候选事件的知识节点与事件结构模式,并对所述子图中连接文本节点和知识节点的边的权重进行初始化,初始化的值为所述潜在事件论元语义相似度得分,对于所述子图中文本节点与文本节点、知识节点与知识节点横向连接的边,将边的权重初始化为1;当所述输入句子的子图中的候选事件的事件结构模式不属于高频事件结构模式时,则将所述子图中连接文本节点和知识节点之间的边的权重设置为0,对于所述子图中文本节点与文本节点、知识节点与知识节点横向连接的边,将边的权重初始化为0;边的权重为0的,表示被过滤的候选事件结构。在一些实施例中,对于所述子图中属于高频事本文档来自技高网...

【技术保护点】
1.一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:/nS1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;/nS2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;/nS3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;/nS4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型。/n

【技术特征摘要】
1.一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:
S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;
S2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;
S3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;
S4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型。


2.如权利要求1所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述事件背景知识图的构建步骤包括:
S1.1:将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点,将事件触发词和事件论元角色的注释标签作为知识节点;
S1.2:将各文本节点和知识节点分别进行连接,分别对事件触发词、事件论元和事件注释之间的关系,文本之间的关系,事件中的核心元素之间的关系,进行事件检测模型的构建。


3.如权利要求2所述的基于显式事件结构知识增强的事件检测方法,其特征在于,各文本节点和知识节点的连接方式包括:
根据事件结构将对应的文本节点与知识节点进行纵向连接;
将事件触发词的文本节点与事件论元的文本节点进行文本横向连接;
将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行知识横向连接。


4.如权利要求3所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述动态知识匹配的步骤包括:
S2.1:将所述事件背景知识图中事件触发词相关的背景知识与所述输入句子中的潜在事件触发词进行匹配;计算所述潜在事件触发词与所述事件背景知识图中事件触发词文本节点之间的事件触发词语义相似度得分;
S2.2:选择所述事件触发词语义相似度得分最高的前k个潜在事件触发词作为候选事件触发词,并将所述候选事件触发词的文本节点所匹配的知识节点的事件类型作为输入句子的候选事件类型;
S2.3:将输入句子中的潜在事件论元与所述事件背景知识图中的事件论元文本节点进行匹配;计算出所述潜在事件论元与所述事件背景知识图中事件论元文本节点之间的事件论元语义相似度得分;
S2.4:选择所述事件论元语义相似度得分得分最高的前k个潜在事件论元,基于所述步骤S2.2获得的所述候选事件类型,选择属于所述候选事件类型的事件论元角色作为输入句子中所述事件论元的知识节点;
S2.5:采用所述步骤S1.1-S1.3的方法构建所述输入句子的子图。


5.如权利要求4所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=cosine(E(wti),E(tnj))
其中,wti表示输入句子中的一个潜在事件触发词,tnj表示事件背景知识图中存在的与潜在事件触发词相同的事件触发词文本节点,cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入;
当所述潜在事件触发词未存在于所述事件背景知识图中时,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn))
其中α是人工设置的可调权重,st和stn是输入句子中...

【专利技术属性】
技术研发人员:郑海涛张奕麟李自然
申请(专利权)人:清华大学深圳国际研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1