一种基于图增强预训练模型的事件预测方法技术

技术编号：33249703 阅读：20 留言：0更新日期：2022-04-27 18:09

本发明专利技术公开了一种基于图增强预训练模型的事件预测方法，包括：获取事件序列，对事件序列进行预训练获得若干个编码向量，并对若干个编码向量进行聚合，获得事件序列的表示向量；基于事件序列的表示向量，获取事件序列中任两个事件的邻接关系；获取事理图谱，基于事理图谱获取事件的逻辑关系；基于任两个事件的邻接关系和事件的逻辑关系完成事件预测。采用事理图谱作为模型学习事件间关系模式的知识库，事理图谱是描述事件及其逻辑关系的图谱，其知识将为事件预测任务提供有力支撑，将预训练语言模型与图结构信息预测进行融合，既能利用预训练模型中的丰富语言学知识，充分理解各个事件的语义，能通过学习事理图谱结构变量实现图结构信息的预测。构信息的预测。构信息的预测。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图增强预训练模型的事件预测方法

[0001]本专利技术属于事件预测领域，特别是涉及一种基于图增强预训练模型的事件预测方法。

技术介绍

[0002]事件预测任务要求机器为给定的一个或多个事件构成的事件上下文选择合适的后续事件。这一任务需要机器在充分理解事件语义的基础之上，进一步理解事件之间的关系。这种预测的能力可以更好地模拟现实事件的发展规律，能够应用在热点事件预测、金融风险预警、舆情分析等领域。为此，部分前期工作提出建模事件对关系与事件间链状关系，以预测给定的事件上下文的后续事件。为有效预测后续事件，模型还需进一步理解事件间的图结构的密集连接关系。此前工作大多利用检索式方法，向事件预测模型中引入图知识。然而，此类方法的表现高度依赖于事理图谱的覆盖度。如果事件未能被事理图谱所覆盖，则此类方法无从获得相应的结构特征，结构信息的缺失将极大影响模型的性能。但实际情况中几乎不可能构建一个覆盖绝大多数可能事件的事理图谱，因为事件是由多个语义元素组成的复杂语义单位。这种复杂性使得对于同一语义的事件对应多种表达方式，这使得事理图谱难以完全覆盖所有可能的事件。这一特性引起了检索式地利用事理图谱信息的困难。

技术实现思路

[0003]本专利技术的目的是提供一种基于图增强预训练模型的事件预测方法，以解决上述现有技术存在的问题。
[0004]为实现上述目的，本专利技术提供了一种基于图增强预训练模型的事件预测方法，包括：
[0005]获取事件序列，对所述事件序列进行预训练获得若干个编码向量，并对若干个所...

【技术保护点】

【技术特征摘要】
1.一种基于图增强预训练模型的事件预测方法，其特征在于，包括以下步骤：获取事件序列，对所述事件序列进行预训练获得若干个编码向量，并对若干个所述编码向量进行聚合，获得事件序列的表示向量；基于所述事件序列的表示向量，获取所述事件序列中任两个事件的邻接关系；获取事理图谱，基于所述事理图谱获取事件的逻辑关系；基于所述任两个事件的邻接关系和所述事件的逻辑关系完成事件预测。2.根据权利要求1所述的方法，其特征在于，对所述事件序列进行预训练获得若干个编码向量的过程中包括：采用预训练语言模型BERT的若干层Transformer作为预训练的编码器；基于所述编码器将所述事件序列中的若干个字符编码为若干个分布式表示向量，将所述分布式表示向量作为所述编码向量。3.根据权利要求2所述的方法，其特征在于，对若干个所述编码向量进行聚合，获得事件的表示向量的过程中包括：基于注意力机制对所述编码向量进行均值池化，获得向量表示；将所有所述向量表示集合成表示矩阵，将所述表示矩阵作为所述事件序列的表示向量。4.根据权利要求1所述的方法，其特征在于，基于所述事件序列的表示向量，获取所述事件序列中任意两个事件的邻接关系的过程中包括：基于双线性机制预测任意两个事件间的邻接关系，获得若干个任意两个事件间的关系强度系数；将若干个所述关系强度系数构成矩阵并进行归一化，获得关系矩阵；基于所述关系矩阵获得所述事件序列中任意两个事件的邻接关系。5.根据权利要求4所述的方法，其特征在于，基于所述双线性机制预测任意两个事件间的邻接关系的过程中，通过如下公式实现：其中为可训练参数，T(
·
)为转置操作，代表在第n层事件i的表示，代表在第n层事件j的表示，Γ
...

【专利技术属性】
技术研发人员：丁效，吴婷婷，杜理，秦兵，刘挺，王若珂，
申请(专利权)人：哈尔滨工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人