System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种危机博弈事件抽取方法、装置、存储介质及电子设备制造方法及图纸_技高网

一种危机博弈事件抽取方法、装置、存储介质及电子设备制造方法及图纸

技术编号:44597680 阅读:0 留言:0更新日期:2025-03-14 12:53
本申请的实施例提供了一种危机博弈事件抽取方法、装置、存储介质及电子设备,涉及事件抽取技术领域,所述方法包括:使用HeidelTime对长文本进行时间标注;采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本;将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取。本申请的技术方案,将长文本时间关联提取工具HeidelTime与大语言模型结合,对长文本中的长关联时间戳进行了非侵入式提示增强,显著提升了模型在事件时间字段上的识别准确率,在总体上提高事件识别率近20%。

【技术实现步骤摘要】

本申请涉及事件抽取,具体而言,涉及一种危机博弈事件抽取方法、装置、存储介质及电子设备


技术介绍

1、事件抽取旨在从纯自然语言文本中提取事件。现有的事件抽取技术在长文本中带有时间戳的事件抽取方面存在诸多困难和局限,具体包括以下几点:

2、第一,缺少训练数据。长文本的事件抽取需要大量带有时间戳的标注数据进行模型训练。然而,目前现有的事件提取模型通常是针对短文本进行训练的,长文本数据集、针对特定数据抽取结构的数据集匮乏导致模型在处理长文本时表现不佳。长文本中的事件通常更为复杂,涉及多种时间关系和上下文信息,而现有的数据集和训练方法难以覆盖所有可能的情况。即使有长文本的数据集,这些数据集通常也未经过严格的时间标注,导致模型难以有效学习和推广。

3、第二,训练需要使用大量资源,且在不同抽取结构/模板间迁移学习困难。长文本事件提取的模型训练需要大量计算资源和时间。这不仅包括基础模型的预训练,还包括针对特定任务的微调。在处理未经任何处理的书籍等长文本时,所需的数据量和计算资源更为庞大。此外,不同的事件抽取任务和模板可能有显著不同,导致模型在一种任务上训练好的参数难以直接迁移到另一种任务上。当前大多数方法采用的sft(structured fromtext)范式虽然在参数分类的度量方面表现较好,但在跨任务迁移和适应新的抽取结构时表现较差。这就使得模型在不同任务之间的迁移学习变得非常困难,无法有效应对多样化的长文本事件抽取需求。

4、第三,调用大语言模型api的零样本事件抽取缺乏统一有效的提示框架。在实际应用中,使用零样本学习或少样本学习的方法直接调用成熟大模型(如chatgpt)的api是一种低成本的选择。然而,这种方法面临着缺乏统一有效的提示框架的问题。现有的大语言模型虽然在一些任务上表现优异,但如何设计有效的提示(prompt)以引导模型正确理解和抽取长文本中的时间戳信息仍然是一个巨大的挑战。特别是对于未经处理的书籍等长文本,设计合理的提示以帮助模型识别和标准化事件时间更加困难。目前还没有一个统一有效的提示框架可以有效地解决这一问题,导致模型在不同上下文和任务中的表现不稳定。

5、第四,现有语言模型的上下文长度不足以支持长上下文的相对时间关系判断。现有的大语言模型在处理长文本时面临着上下文长度的限制。大多数模型的输入输出长度有限,无法直接处理长文本中的所有上下文信息。这意味着在长文本中,模型无法一次性读取所有内容,导致事件抽取过程中的信息不完全。如果将长文本分段输入,模型在处理每一段时缺乏全局上下文信息,特别是相对时间关系的判断。分段输入会导致上下文时间关系的丢失,使得模型无法准确地捕捉事件之间的时间关联,从而影响事件抽取的准确性和完整性。

6、此外,即使能够部分克服上下文长度的限制,长文本的事件抽取还涉及复杂的时间标准化处理。不同事件之间的时间关系可能依赖于全文的多处上下文信息,而非单一段落的信息。因此,现有方法在长文本中的时间推断和标准化处理方面表现较差,难以满足精确的事件时间抽取需求。


技术实现思路

1、本申请的实施例提供了一种危机博弈事件抽取方法、装置、存储介质及电子设备,以解决现有技术中存在的问题。

2、本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。

3、根据本申请实施例的第一方面,提供了一种危机博弈事件抽取方法,包括:

4、使用heideltime对长文本进行时间标注;

5、采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本;

6、将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取。

7、在本申请的一些实施例中,基于前述方案,所述使用heideltime对长文本进行时间标注,包括:

8、使用heideltime基于模式匹配与规则对长文本的时间信息进行标准化处理;

9、利用timex3标签对标准化处理后的时间信息进行标注。

10、在本申请的一些实施例中,基于前述方案,所述采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本,包括:

11、解析经过时间标注的长文本,获取长文本的中所有的timex3标签信息;

12、获取每个timex3标签中的时间值,使用正则表达式将时间值匹配具体的年、月、日,并转换为第一python日期对象;

13、使用python日期解析器解析timex3标签中的内部文本,将内部文本转换为第二python日期对象;

14、比较第一python日期对象和第二python日期对象,若二者日期不一致,则将标准化的日期值附加在内部文本后。

15、在本申请的一些实施例中,基于前述方案,在将带有非侵入式时间提示的长文本作为大语言模型的输入之前,还包括:

16、将带有非侵入式时间提示的长文本进行文本分段处理以及定义事件角色。

17、在本申请的一些实施例中,基于前述方案,所述将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取,包括:

18、以分段处理后的带有非侵入式时间提示的长文本作为输入,结合事件角色和非侵入式时间提示进行危机博弈事件的抽取。

19、根据本申请实施例的第二方面,提供了一种危机博弈事件抽取装置,包括:

20、时间标注单元,用于使用heideltime对长文本进行时间标注;

21、生成单元,用于采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本;

22、抽取单元,用于将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取。

23、根据本申请实施例的第三方面,提供了一种计算机可读存储介质,所述存储介质上存储有计算机指令,所述计算机指令在计算机上运行时,使得所述计算机执行如第一方面所述的方法。

24、根据本申请实施例的第四方面,提供了一种电子设备,包括:存储器和处理器;

25、所述存储器,用于存储计算机指令;

26、所述处理器,用于调用所述存储器中存储的计算机指令,使得所述电子设备执行如第一方面所述的方法。

27、本申请的技术方案,将长文本时间关联提取工具heideltime与大语言模型结合,对长文本中的长关联时间戳进行了非侵入式提示增强,显著提升了模型在事件时间字段上的识别准确率,在总体上提高事件识别率近20%。

28、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

本文档来自技高网...

【技术保护点】

1.一种危机博弈事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述使用HeidelTime对长文本进行时间标注,包括:

3.根据权利要求2所述的方法,其特征在于,所述采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本,包括:

4.根据权利要求1所述的方法,其特征在于,在将带有非侵入式时间提示的长文本作为大语言模型的输入之前,还包括:

5.根据权利要求1所述的方法,其特征在于,所述将带有非侵入式时间提示的长文本作为大语言模型的输入,进行危机博弈事件的抽取,包括:

6.一种危机博弈事件抽取装置,其特征在于,包括:

7.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机指令,所述计算机指令在计算机上运行时,使得所述计算机执行如权利要求1-5中任一项所述的方法。

8.一种电子设备,其特征在于,包括:存储器和处理器;

【技术特征摘要】

1.一种危机博弈事件抽取方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述使用heideltime对长文本进行时间标注,包括:

3.根据权利要求2所述的方法,其特征在于,所述采用非侵入式文本提示技术在经过时间标注后的长文本上生成时间提示,得到带有非侵入式时间提示的长文本,包括:

4.根据权利要求1所述的方法,其特征在于,在将带有非侵入式时间提示的长文本作为大语言模型的输入之前,还包括...

【专利技术属性】
技术研发人员:刘万里张天翼刘鑫陈俞舟唐世平冯收刘禄波
申请(专利权)人:中国电子科技集团公司第十研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1