System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大语言模型的事件关系推理演化方法、装置、设备以及存储介质制造方法及图纸_技高网

基于大语言模型的事件关系推理演化方法、装置、设备以及存储介质制造方法及图纸

技术编号:42189935 阅读:9 留言:0更新日期:2024-07-30 18:40
本发明专利技术公开了一种基于大语言模型的事件关系推理演化方法、装置、设备以及存储介质,该方法通过构建事件触发词提取指令‑标签监督数据,利用大语言模型和微调实现事件触发词提取;构建多任务指令,统一事件关系推理任务;为每个细粒度事件关系推理任务学习相应的软提示,并设计协同融合机制提升事件关系推理性能;基于推理得到的事件关系,根据指令需求及语境学习生成事件关系链;利用大语言模型的世界知识,设计事件演化指令和语境学习,实现事件演化,预测事件的发展趋势,生成事件演化链;根据事件演化的结果进行风险评估,生成事件风险链。本发明专利技术增强了大语言模型进行事件关系推理时的泛化能力,可以根据不同的需求指令实现多种事件关系推理任务,提高了事件关系推理的准确率。

【技术实现步骤摘要】

本专利技术涉及信息中的自然语言处理领域,尤其涉及人工智能、大语言模型、事件关系推理和事件演化等。具体地,本专利技术提供一种基于大语言模型的事件关系推理演化方法、装置、设备以及存储介质


技术介绍

1、事件关系推理演化(event relation reasoning)旨在通过分析文本中描述的事件,理解事件之间的关系演化,推断事件之间的逻辑关系,是自然语言处理中的重要子任务之一。伴随着深度学习的不断发展,众多研究受到神经网络的启发,使用预训练语言模型,并结合注意力机制来进行事件关系推理演化任务,然而,这些现有的深度学习模型将事件关系推理演化任务割裂成单独的子任务进行研究,忽略了不同事件关系推理演化任务之间的关联性。其次,由于事件之间的关系可能涉及长时间间隔,受限于bert等预训练模型的性能,现有的方法无法很好的建模和追踪长期的事件依赖关系,仍存在一定的局限性。

2、随着大模型时代的到来,其惊艳的生成及泛化能力将自然语言处理领域推到一个新的阶段。大模型使得更强大的上下文建模成为可能。模型能够对长文本序列进行更深入的理解,从而更好地捕捉事件演化的动态性。这对于解决涉及长时间间隔的事件关系推理问题至关重要。其次,大语言模型自身蕴含丰富的世界知识有助于进行事件触发词抽取;其强大的理解和推理能力增强了对事件关系推理演化任务的语义理解能力,为模型更好地理解和推理事件之间的关系提供了强大的基础。

3、当下,现有的事件关系推理演化方法中存在以下问题:

4、1)现有的基于深度学习的方法对长距离的事件间依赖关系的建模能力不足。由于深度学习模型通常采用局部上下文信息,较长的文本序列可能导致梯度消失或梯度爆炸的问题,从而限制了模型对于远距离依赖关系的准确建模。这种限制在事件推理任务中尤为显著,因为事件之间的关联可能涉及到跨越数个句子或文档段落的复杂信息传递。

5、2)现有的事件关系推理方法对不同的事件关系单独建模进行研究,割裂了多种事件关系之间的关联性,例如,事件因果关系在时序上一定存在先后顺序。其次,单独对不同事件关系推理任务进行建模需要耗费大量的训练及存储开销。

6、为解决上述事件关系推理演化方法中存在的问题,本专利技术提供了一种基于大语言模型的事件关系推理演化方法、装置、设备以及存储介质。本申请的技术基于大语言模型,涉及到指令学习、软提示学习及语境学习三种方法,在大语言模型的基础上,引入指令学习统一对事件关系推理进行建模,借助语境学习引导模型按需进行事件关系推理演化;通过软提示学习降低训练资源,在不改变大语言模型基础的前提下,缓解模型训练时的资源及消耗问题。


技术实现思路

1、本专利技术目的在于,提供了一种基于大语言模型的事件关系推理演化方法、装置、设备以及存储介质,通过构建事件触发词提取指令-标签监督数据,利用大语言模型和微调实现事件触发词提取;构建多任务指令,统一事件关系推理任务;为每个细粒度事件关系推理任务学习相应的软提示,并设计协同融合机制提升事件关系推理性能;基于推理得到的事件关系,根据指令需求及语境学习生成事件关系链;利用大语言模型的世界知识,设计事件演化指令和语境学习,实现事件演化,预测事件的发展趋势,生成事件演化链;根据事件演化的结果进行风险评估,生成事件风险链。本专利技术增强了大语言模型进行事件关系推理时的泛化能力,可以根据不同的需求指令实现多种事件关系推理任务,提高了事件关系推理的准确率。

2、本专利技术所述的一种基于大语言模型的事件关系推理演化方法,按下列步骤进行:

3、a、构建事件触发词提取指令-标签监督数据,是以已有的传统事件触发词提取数据集为基础,对于每个选定的训练样本构建相应的事件触发词提取指令,在构建指令-标签数据集时,确保覆盖不同领域、语境和复杂性的样本;

4、b、根据所述指令-标签监督数据,基于大语言模型及指令微调实现事件触发词提取;

5、c、统一事件关系推理任务,构造多任务指令,用于推断事件之间的时序、因果等逻辑关系;基于多任务指令学习统一训练一个基础,多任务指令包含多个子指令,每个子指令对应一种事件关系推理的子任务,根据多任务指令学习一个具备基础事件关系推理能力的大语言模型,其能够实现多种事件关系推理任务;

6、d、针对每一种细粒度事件关系推理任务,添加相应的软提示,引导大语言模型完成特定的事件关系推理,基于步骤c所述的具备基础事件关系推理能力的大语言模型,在其每一层中添加连续可学习的前缀,用于学习细粒度事件关系推理知识,通过软提示微调来学习和有效地保存特定事件关系推理知识;

7、e、根据所述步骤d的特定软提示,以软提示协同推理的方式优化推理事件关系,将蕴含多种事件关系推理知识的前缀进行融合,通过协同软提示的方式,提升事件关系推理的性能,包含事件时序、因果等逻辑关系;

8、f、根据所述推理得到的事件关系,根据指令需求及语境学习,生成事件关系链;

9、g、在生成所述事件关系链后,基于大语言模型所蕴含丰富的世界知识,设计事件演化指令及语境学习实现事件演化,预测事件的发展趋势,生成事件演化链;

10、h、根据对上述的事件演化后,依照演化后的事件对当前事件进行风险评估,生成事件风险链,其中,基于事件演化链,结合当前的事件脉络以自然语言文本的方式将二者进行合并,借助大语言模型分析事件链中每个事件的风险大小。

11、步骤a中所述事件触发词提取指令,明确而简洁地表达与事件触发词提取相关的操作或需求,以便大模型能够准确理解指令与相应标签之间的关系。

12、步骤f中所述的指令需求及语境学习:指令需求为明确描述生成事件关系链的自然语言文本,语境学习在模型生成事件关系链的过程中,提供一些任务示例,让大语言模型根据示例来学习任务的语义和格式,在不改变参数的情况下,通过观察和模范来解决生成事件关系链。例如事件时序链、事件因果链。

13、步骤g中所述的事件演化指令及语境学习为事件演化指令为一种指定事件演化方向的自然语言文本,用于引导大模型完成特定的事件演化任务,预测事件的未来发展和可能得结果。根据语境学习提供的任务示例来引导和规范大语言模型生成事件演化链。

14、一种所述的基于大语言模型的事件关系推理演化方法的装置,该装置包括:事件触发词提取模块、多任务指令学习模块、软提示微调模块,软提示协同推理模块、事件关系链生成模块、事件演化链生成模块及事件风险评估模块,其中:

15、事件触发词提取模块:利用大语言模型的强大语言理解能力,基于指令学习的方式从输入的句子中进行事件触发词的提取;

16、多任务指令学习模块:以生成式的范式统一进行事件关系推理,构造多任务指令,用于推断事件与事件之间的时序、因果等逻辑关系;

17、软提示微调模块:针对每一种细粒度事件关系推理任务,添加相应的软提示,引导大语言模型完成特定的事件关系推理任务。软提示微调模块通过在多任务指令的基础上,添加相应的软提示,使其能够更好地完成本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的事件关系推理演化方法,其特征在于,按下列步骤进行:

2.根据权利要求1所述的一种基于大语言模型的事件关系推理演化方法,步骤a中所述事件触发词提取指令,明确而简洁地表达与事件触发词提取相关的操作或需求,以便大模型能够准确理解指令与相应标签之间的关系。

3.根据权利要求1所述的一种基于大语言模型的事件关系推理演化方法,步骤f中所述的指令需求及语境学习:指令需求为明确描述生成事件关系链的自然语言文本,语境学习在模型生成事件关系链的过程中,提供一些任务示例,让大语言模型根据示例来学习任务的语义和格式,在不改变参数的情况下,通过观察和模范来解决生成事件关系链。例如事件时序链、事件因果链。

4.根据权利要求1所述的一种基于大语言模型的事件关系推理演化方法,其中,步骤g中所述的事件演化指令及语境学习为事件演化指令为一种指定事件演化方向的自然语言文本,用于引导大模型完成特定的事件演化任务,预测事件的未来发展和可能得结果。根据语境学习提供的任务示例来引导和规范大语言模型生成事件演化链。

5.一种基于权利要求1所述的基于大语言模型的事件关系推理演化方法的装置,其特征在于该装置包括:事件触发词提取模块、多任务指令学习模块、软提示微调模块,软提示协同推理模块、事件关系链生成模块、事件演化链生成模块及事件风险评估模块,其中:

6.一种电子设备,其中,包括:至少一个处理器;1至少一张GPU计算卡;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行或所述至少一个GPU计算卡执行,以使所述至少一个处理器能或所述至少一个GPU计算卡能够执行权利要求1-4中任一项所述的方法。

7.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行权利要求1-4中任一项所述的方法。

...

【技术特征摘要】

1.一种基于大语言模型的事件关系推理演化方法,其特征在于,按下列步骤进行:

2.根据权利要求1所述的一种基于大语言模型的事件关系推理演化方法,步骤a中所述事件触发词提取指令,明确而简洁地表达与事件触发词提取相关的操作或需求,以便大模型能够准确理解指令与相应标签之间的关系。

3.根据权利要求1所述的一种基于大语言模型的事件关系推理演化方法,步骤f中所述的指令需求及语境学习:指令需求为明确描述生成事件关系链的自然语言文本,语境学习在模型生成事件关系链的过程中,提供一些任务示例,让大语言模型根据示例来学习任务的语义和格式,在不改变参数的情况下,通过观察和模范来解决生成事件关系链。例如事件时序链、事件因果链。

4.根据权利要求1所述的一种基于大语言模型的事件关系推理演化方法,其中,步骤g中所述的事件演化指令及语境学习为事件演化指令为一种指定事件演化方向的自然语言文本,用于引导大模型完成特定的事...

【专利技术属性】
技术研发人员:马博王磊杨雅婷马荣董瑞周喜
申请(专利权)人:中国科学院新疆理化技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1