一种事件共指消解方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:35824878 阅读:13 留言:0更新日期:2022-12-03 13:51
本申请涉及一种事件共指消解方法、装置、计算机设备和存储介质。所述方法包括:构建了事件共指消解模型,包括事件抽取组件、提及编码器组件、共指得分器组件和事件共指链重构模块,通过显式建模论元信息,将论元划分为包含施事者、受事者、时间、地点和其他共五种角色,既满足分别处理对应角色论元的需求,也保证所有的论元信息都囊括其中;通过在论元表示中引入置信分数,缓解错误传播带来的消极影响;通过门控过滤机制,利用触发词过滤论元中的噪声,进一步缓解错误传播;通过重构事件链的算法,进一步提升了事件共指消解模型的性能。本发明专利技术从多个角度对事件共指消解模型进行了改进,提高了模型的泛化性,优化了推断结果的准确性。确性。确性。

【技术实现步骤摘要】
一种事件共指消解方法、装置、计算机设备和存储介质


[0001]本申请涉及事件图谱领域,特别是涉及一种通过建模论元和重建事件链的事件共指消解方法、装置、计算机设备和存储介质。

技术介绍

[0002]文档内事件共指消解是一种识别并聚类一段文本中指代相同真实事件的事件提及的任务。它是个富有挑战的研究,并且有很多应用。事件主要由触发词和事件论元构成。触发词是句子中能最清晰地描述事件发生的主要单词,而事件论元包括事件的其他重要信息,比如施事者、受事者、时间和地点等。
[0003]在ACE2005相关定义中,一个事件提及有且仅有一个触发词。相比于触发词,论元更复杂,如何合理使用论元帮助解决事件共指是一个难题。一方面,不同类型的事件具有不同角色的事件论元,并且单个事件同种角色的论元可能不止一个。另一方面,文本中的事件提及的论元不可能都存在,换句话说,对应某些角色的论元是缺失的。
[0004]先前在事件共指消解的工作通常直接使用标注好的事件信息(Bejan and Harabagiu,2010;Krause et al.,2016),这类方法对标注数据的严重依赖并且泛化性差。现阶段的研究主要在未标注语料中进行事件共指消解(Peng et al.,2016;Lu and Vincent,2017),这类方法更具挑战性和实际意义。Peng等设计一个事件抽取和事件共指消解的管道模型,从未标注文本中抽取事件信息并共指消解,但管道法存在错误传播问题,Lu和Vincent提出一种联合学习模型,联合学习事件检测任务、事件回指检测和事件共指消解任务,联合模型的各个子任务相互促进,可以有效缓解错误传播问题,使模型达到最佳的性能。
[0005]事件论元作为事件的关键信息,在事件共指消解任务中广泛使用(Huang et al.,2019;Zeng et al.,2020;Lu and Vincent,2021;Chen et al.,2021;Lu et al.,2022)。使用事件论元解决事件共指消解基于这样一个事实:如果两个事件提及是共指的,那么它们对应角色的论元也是共指的。Lu等使用BERT隐式建模事件论元,联合学习事件检测和事件共指消解。Lu和Vincent不区分事件和论元,使用span代替它们,基于SpanBERT模型联合学习事件共指消解和实体共指消解,并通过添加软约束和硬约束来限制结果。Chen等只利用触发词和部分论元解决事件共指,遗漏了部分重要论元信息。
[0006]另外,现有技术在进行事件共指链的推断时,通常只考虑局部一致性,所得到的推断结果无法保证全局最佳。
[0007]现有技术存在泛化性差和效果不佳的问题。

技术实现思路

[0008]基于此,有必要针对上述技术问题,提供一种能够显式建模事件论元的事件共指消解方法、装置、计算机设备和存储介质。
[0009]一种事件共指消解方法,所述方法包括:
[0010]获取待进行事件共指消解的训练数据集;
[0011]将所述训练数据集输入事件共指消解模型;所述事件共指消解模型包括事件抽取组件、提及编码器组件、共指得分器组件和事件共指链重构模块;
[0012]所述事件抽取组件用于根据所述训练数据集中的文档数据得到多个事件提及;每个所述事件提及中包括事件的触发词、论元和事件子类型;所述论元被划分为施事者、受事者、时间、地点和其他共五种角色;
[0013]所述提及编码器组件用于根据所述事件提及和对应文档的词元数据得到任一事件提及的触发词表示和论元角色的论元表示;其中所述论元表示中包括论元置信分数;进一步得到任意两个事件提及的触发词对表示和论元对表示,通过门控过滤机制,根据所述触发词对表示对所述论元对表示进行过滤,得到过滤后的论元对表示,进而根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示;
[0014]所述共指得分器组件用于根据所述提及对表示得到任意两个事件提及的共指得分;
[0015]所述事件共指链重构模块用于根据所述共指得分得到所述训练数据集中对应文档的初始事件共指链,通过计算所述初始事件共指链中单链与其他事件链的共指得分对所述单链进行验证,通过计算所述初始事件共指链中长链中的任一事件提及与所述长链中其他事件提及的共指得分,对所述长链进行验证,进而对所述初始事件共指链进行重构,得到预测的最终事件共指链;
[0016]通过所述训练数据集和所述预测的最终事件共指链对所述事件共指消解模型进行训练,得到训练好的事件共指消解模型;
[0017]将待进行事件共指消解的文档数据输入所述训练好的事件共指消解模型,得到所述文档数据对应的最终事件共指链。
[0018]在其中一个实施例中,还包括:获取所述事件抽取组件输出的k个事件提及{m1,m2,

,m
k
}和对应文档的n个词元数据;
[0019]通过transformer编码器为每个输入词元形成上下文表示为X=(X1,X2,

,X
n
);其中,d表示每个词元编码后的向量维度;
[0020]对于每个事件提及m
i
,所述事件提及m
i
的触发词表示t
i
被定义为其词元嵌入的平均值:
[0021][0022]其中,s
i
和e
i
分别表示触发词的开始和结束索引;
[0023]所述事件提及m
i
对应角色r的论元表示为:
[0024][0025][0026]其中,r∈{agent,patient,time,place,other},agent,patient,time,place,other分别为施事者、受事者、时间、地点和其他共五种论元角色,是提及m
i
对应角色r
的第l个论元的表示,和分别表示第l个论元的开始和结束索引,c表示第l个论元的置信分数,u表示m
i
对应角色r的论元个数;当m
i
对应角色r的论元缺省或不存在,使用d维0向量表示。
[0027]在其中一个实施例中,还包括:给定两个事件提及m
i
和m
j
,分别定义触发词对表示和对应角色r的论元对表示为:
[0028][0029][0030]其中,FFNN
t
是一个的标准前馈神经网络,编码m
i
和m
j
的元素级相似性。
[0031]在其中一个实施例中,还包括:根据所述触发词对表示t
ij
对所述论元对表示进行正交分解,得到所述论元对表示的正交分量和平行分量分别为:
[0032][0033][0034]定义所述正交分量和所述平行分量的权重系数分别为:
[0035][0036]ω
p
=1

ω
o
[0037]其中,ω
o<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种事件共指消解方法,其特征在于,所述方法包括:获取待进行事件共指消解的训练数据集;将所述训练数据集输入事件共指消解模型;所述事件共指消解模型包括事件抽取组件、提及编码器组件、共指得分器组件和事件共指链重构模块;所述事件抽取组件用于根据所述训练数据集中的文档数据得到多个事件提及;每个所述事件提及中包括事件的触发词、论元和事件子类型;所述论元被划分为施事者、受事者、时间、地点和其他共五种角色;所述提及编码器组件用于根据所述事件提及和对应文档的词元数据得到任一事件提及的触发词表示和论元角色的论元表示;其中所述论元表示中包括论元置信分数;进一步得到任意两个事件提及的触发词对表示和论元对表示,通过门控过滤机制,根据所述触发词对表示对所述论元对表示进行过滤,得到过滤后的论元对表示,进而根据所述触发词对表示和过滤后的论元对表示得到任意两个事件提及的提及对表示;所述共指得分器组件用于根据所述提及对表示得到任意两个事件提及的共指得分;所述事件共指链重构模块用于根据所述共指得分得到所述训练数据集中对应文档的初始事件共指链,通过计算所述初始事件共指链中单链与其他事件链的共指得分对所述单链进行验证,通过计算所述初始事件共指链中长链中的任一事件提及与所述长链中其他事件提及的共指得分,对所述长链进行验证,进而对所述初始事件共指链进行重构,得到预测的最终事件共指链;通过所述训练数据集和所述预测的最终事件共指链对所述事件共指消解模型进行训练,得到训练好的事件共指消解模型;将待进行事件共指消解的文档数据输入所述训练好的事件共指消解模型,得到所述文档数据对应的最终事件共指链。2.根据权利要求1所述的方法,其特征在于,根据所述事件提及和对应文档的词元数据得到任一事件提及的触发词表示和论元角色的论元表示,包括:获取所述事件抽取组件输出的k个事件提及{m1,m2,

,m
k
}和对应文档的n个词元数据;通过transformer编码器为每个输入词元形成上下文表示为X=(X1,X2,

,Xn);其中,d表示每个词元编码后的向量维度;对于每个事件提及m
i
,所述事件提及m
i
的触发词表示t
i
被定义为其词元嵌入的平均值:其中,s
i
和e
i
分别表示触发词的开始和结束索引;所述事件提及m
i
对应角色r的论元表示为:对应角色r的论元表示为:其中,r∈{agent,patient,time,place,other},agent,patient,time,place,other分别为施事者、受事者、时间、地点和其他共五种论元角色,是提及m
i
对应角色r的第l个
论元的表示,和分别表示第l个论元的开始和结束索引,c表示第l个论元的置信分数,u表示m
i
对应角色r的论元个数;当m
i
对应角色r的论元缺省或不存在,使用d维0向量表示。3.根据权利要求2所述的方法,其特征在于,进一步得到任意两个事件提及的触发词对表示和论元对表示,包括:给定两个事件提及m
i
和m
j
,分别定义触发词对表示和对应角色r的论元对表示为:,分别定义触发词对表示和对应角色r的论元对表示为:其中,FFNN
t
是一个的标准前馈神经网络,编码m
i
和m
j
的元素级相似性。4.根据权利要求3所述的方法,其特征在于,通过门控过滤机制,根据所述触发词对表示对所述论元对表示进行过滤,得到过滤后的论元对表示,包括:根据所述触发词对表示t
ij
对所述论元对表示进行正交分解,得到所述论元对表示的正交分量和平行分量分别为:分别为:定义所述正交分量和所述平行分量的权重系数分别为:ω
p
=1

ω
o
其中,ω
o
和ω
p
分别是所述正交分量和所述平行分量的权重系数,FFNN
p
是一个的前...

【专利技术属性】
技术研发人员:蒋国权环志刚丁鲲刘浏刘姗姗张骁雄张慧刘茗
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1