【技术实现步骤摘要】
基于显式事件结构知识增强的事件检测方法及终端设备
本专利技术涉及自然语言处理
,尤其是涉及基于显式事件结构知识增强的事件检测方法。
技术介绍
事件检测旨在从非结构化的文本中识别特定类型的事件,但现有的事件检测任务中对于带有歧义的触发词和生僻触发词存在检测效率低下的问题,事件检测中的歧义触发词和生僻触发词示例如图1所示。由于自然语言自身带有一定的多样性和歧义性,相同的事件触发词可能会根据上下文语境的不同从而代表不同的事件类别。在没有其他额外的知识或信息作为参考的情况下,歧义触发词可能会导致事件检测系统错误地对触发词的事件类别进行标记。现有技术为解决歧义触发词的问题,通常对上下文中其他事件元素的信息进行学习,而并没有对事件自身的结构知识进行探索与利用。对事件检测任务来说,识别生僻触发词等未在训练数据集中出现过的事件触发词同样也是一项艰巨的挑战。现有的事件检测模型通常通过学习同种事件类型下其他事件触发词的通用知识来检测生僻触发词。因此,如何从其他事件中选择更合适的通用知识,并采用全方位的事件结构知识来增强生僻触发词的向量表示仍然值得探索。
技术实现思路
本专利技术的目的在于提供一种基于显式事件结构知识增强的事件检测方法,以解决歧义触发词和生僻触发词检测准确率和召回率低的技术问题。为实现上述目的,本专利技术采用下述技术方案:一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件 ...
【技术保护点】
1.一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:/nS1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;/nS2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;/nS3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;/nS4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型。/n
【技术特征摘要】
1.一种基于显式事件结构知识增强的事件检测方法,其特征在于,包括如下步骤:
S1:根据包括事件类型、事件触发词、事件论元角色和事件中的核心元素的事件结构构建事件背景知识图,实现对事件结构显式地构建事件检测模型;
S2:将所述事件背景知识图中的事件结构的知识与输入句子进行动态知识匹配,构建属于所述输入句子的包含高度相关的事件背景知识的子图;
S3:对所述子图进行过滤和编码,并通过图卷积计算得到包含事件结构的知识的信息的图表示;
S4:将所述包含事件结构的知识的信息的图表示输入事件检测分类器中,确定事件触发词的类别,并根据事件触发词的类别确定所述输入句子对应的事件类型。
2.如权利要求1所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述事件背景知识图的构建步骤包括:
S1.1:将事件触发词和事件论元的文字作为所述事件背景知识图的文本节点,将事件触发词和事件论元角色的注释标签作为知识节点;
S1.2:将各文本节点和知识节点分别进行连接,分别对事件触发词、事件论元和事件注释之间的关系,文本之间的关系,事件中的核心元素之间的关系,进行事件检测模型的构建。
3.如权利要求2所述的基于显式事件结构知识增强的事件检测方法,其特征在于,各文本节点和知识节点的连接方式包括:
根据事件结构将对应的文本节点与知识节点进行纵向连接;
将事件触发词的文本节点与事件论元的文本节点进行文本横向连接;
将事件触发词的知识节点与同一事件内的其他论元角色的知识节点进行知识横向连接。
4.如权利要求3所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述动态知识匹配的步骤包括:
S2.1:将所述事件背景知识图中事件触发词相关的背景知识与所述输入句子中的潜在事件触发词进行匹配;计算所述潜在事件触发词与所述事件背景知识图中事件触发词文本节点之间的事件触发词语义相似度得分;
S2.2:选择所述事件触发词语义相似度得分最高的前k个潜在事件触发词作为候选事件触发词,并将所述候选事件触发词的文本节点所匹配的知识节点的事件类型作为输入句子的候选事件类型;
S2.3:将输入句子中的潜在事件论元与所述事件背景知识图中的事件论元文本节点进行匹配;计算出所述潜在事件论元与所述事件背景知识图中事件论元文本节点之间的事件论元语义相似度得分;
S2.4:选择所述事件论元语义相似度得分得分最高的前k个潜在事件论元,基于所述步骤S2.2获得的所述候选事件类型,选择属于所述候选事件类型的事件论元角色作为输入句子中所述事件论元的知识节点;
S2.5:采用所述步骤S1.1-S1.3的方法构建所述输入句子的子图。
5.如权利要求4所述的基于显式事件结构知识增强的事件检测方法,其特征在于,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=cosine(E(wti),E(tnj))
其中,wti表示输入句子中的一个潜在事件触发词,tnj表示事件背景知识图中存在的与潜在事件触发词相同的事件触发词文本节点,cosine表示余弦相似度计算,E表示通过ELMo模型获取的词嵌入;
当所述潜在事件触发词未存在于所述事件背景知识图中时,所述事件触发词语义相似度得分的计算公式为:
simtrg(wti,tnj)=α*cosine(E(wti),E(tnj))+(1-α)*cosine(E(st),E(stn))
其中α是人工设置的可调权重,st和stn是输入句子中...
【专利技术属性】
技术研发人员:郑海涛,张奕麟,李自然,
申请(专利权)人:清华大学深圳国际研究生院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。