System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 文本分析模型的训练方法、文本分析方法及装置制造方法及图纸_技高网

文本分析模型的训练方法、文本分析方法及装置制造方法及图纸

技术编号:42707748 阅读:0 留言:0更新日期:2024-09-13 12:00
本说明书一个或多个实施例公开了一种文本分析模型的训练方法、文本分析方法及装置。文本分析模型的训练方法包括:获取第一样本数据集合和第二样本数据集合,第一样本数据集合包括第一样本文本和第一标签信息,第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将第一样本数据集合输入基座模型,对第一样本文本进行文本分析,得到第一分析结果。然后,根据第一分析结果和第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器。在训练后的适配器的参数固定的情况下,将第二样本数据集合输入基座模型,对第二样本文本进行文本分析,得到第二分析结果。之后,根据第二分析结果和第二标签信息对编码器的参数进行调整,得到目标文本分析模型。

【技术实现步骤摘要】

本说明书涉及自然语言处理,尤其涉及一种文本分析模型的训练方法、文本分析方法及装置


技术介绍

1、在自然语言处理
中,基于阅读理解框架的文本分析模型是常用的一种文本分析方式。阅读理解框架是指首先根据任务特性设计问题,然后再利用设计好的问题结合文本分析模型输出正确的结果。例如,针对文本“这家餐厅的服务态度很好”设计以下问题:“这段文本中的观点词是什么?”,将该文本输入文本分析模型,阅读理解框架就会让文本分析模型输出该问题的准确答案,如“服务态度”。目前,基于阅读理解框架的文本分析模型通常基于特定的文本分析任务训练得到,在文本分析任务包含多个的情况下,文本分析模型的训练过程就会更加复杂,文本分析模型的性能就会随之受到影响。因此,如何基于阅读理解框架训练出性能高的文本分析模型,是目前亟待解决的问题之一。


技术实现思路

1、一方面,本说明书一个或多个实施例提供一种文本分析模型的训练方法,包括:获取第一样本数据集合和第二样本数据集合,所述第一样本数据集合包括第一样本文本和第一标签信息,所述第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将所述第一样本数据集合输入基座模型,对所述第一样本文本进行文本分析,得到第一分析结果。根据所述第一分析结果和所述第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器,其中,所述基座模型包括所述编码器和所述待训练的适配器。在所述训练后的适配器的参数固定的情况下,将所述第二样本数据集合输入所述基座模型,对所述第二样本文本进行文本分析,得到第二分析结果。根据所述第二分析结果和所述第二标签信息,对所述编码器的参数进行调整,得到目标文本分析模型。

2、另一方面,本说明书一个或多个实施例提供一种文本分析方法,包括:获取目标文本。将所述目标文本输入目标文本分析模型,通过编码器对所述目标文本进行特征提取,得到所述目标文本在文本维度上的第一特征信息。通过各任务维度上的适配器,基于所述第一特征信息对所述目标文本进行特征提取,得到所述目标文本在各所述任务维度上的第二特征信息,所述目标文本分析模型根据上述一方面所述的文本分析模型的训练方法训练得到。根据所述第一特征信息和所述第二特征信息对所述目标文本进行分析,得到文本分析结果。

3、再一方面,本说明书一个或多个实施例提供一种文本分析模型的训练装置,包括:第一获取模块,获取第一样本数据集合和第二样本数据集合,所述第一样本数据集合包括第一样本文本和第一标签信息,所述第二样本数据集合包括第二样本文本和第二标签信息。第一调整模块,在编码器的参数固定的情况下,将所述第一样本数据集合输入基座模型,对所述第一样本文本进行文本分析,得到第一分析结果。根据所述第一分析结果和所述第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器,其中,所述基座模型包括所述编码器和所述待训练的适配器。第一分析模块,在所述训练后的适配器的参数固定的情况下,将所述第二样本数据集合输入所述基座模型,对所述第二样本文本进行文本分析,得到第二分析结果。第二调整模块,根据所述第二分析结果和所述第二标签信息,对所述编码器的参数进行调整,得到目标文本分析模型。

4、再一方面,本说明书一个或多个实施例提供一种文本分析装置,包括:第二获取模块,获取目标文本。第一提取模块,将所述目标文本输入目标文本分析模型,通过编码器对所述目标文本进行特征提取,得到所述目标文本在文本维度上的第一特征信息。第二提取模块,通过各任务维度上的适配器,基于所述第一特征信息对所述目标文本进行特征提取,得到所述目标文本在各所述任务维度上的第二特征信息,所述目标文本分析模型根据上述一方面所述的文本分析模型的训练方法训练得到。第二分析模块,根据所述第一特征信息和所述第二特征信息对所述目标文本进行分析,得到文本分析结果。

5、再一方面,本说明书一个或多个实施例提供一种电子设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:获取第一样本数据集合和第二样本数据集合,所述第一样本数据集合包括第一样本文本和第一标签信息,所述第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将所述第一样本数据集合输入基座模型,对所述第一样本文本进行文本分析,得到第一分析结果。根据所述第一分析结果和所述第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器,其中,所述基座模型包括所述编码器和所述待训练的适配器。在所述训练后的适配器的参数固定的情况下,将所述第二样本数据集合输入所述基座模型,对所述第二样本文本进行文本分析,得到第二分析结果。根据所述第二分析结果和所述第二标签信息,对所述编码器的参数进行调整,得到目标文本分析模型。

6、再一方面,本说明书一个或多个实施例提供一种电子设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:获取目标文本。将所述目标文本输入目标文本分析模型,通过编码器对所述目标文本进行特征提取,得到所述目标文本在文本维度上的第一特征信息。通过各任务维度上的适配器,基于所述第一特征信息对所述目标文本进行特征提取,得到所述目标文本在各所述任务维度上的第二特征信息,所述目标文本分析模型根据上述一方面所述的文本分析模型的训练方法训练得到。根据所述第一特征信息和所述第二特征信息对所述目标文本进行分析,得到文本分析结果。

7、再一方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:获取第一样本数据集合和第二样本数据集合,所述第一样本数据集合包括第一样本文本和第一标签信息,所述第二样本数据集合包括第二样本文本和第二标签信息。在编码器的参数固定的情况下,将所述第一样本数据集合输入基座模型,对所述第一样本文本进行文本分析,得到第一分析结果。根据所述第一分析结果和所述第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器,其中,所述基座模型包括所述编码器和所述待训练的适配器。在所述训练后的适配器的参数固定的情况下,将所述第二样本数据集合输入所述基座模型,对所述第二样本文本进行文本分析,得到第二分析结果。根据所述第二分析结果和所述第二标签信息,对所述编码器的参数进行调整,得到目标文本分析模型。

8、再一方面,本说明书实施例提供一种存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现以下流程:获取目标文本。将所述目标文本输入目标文本分析模型,通过编码器对所述目标文本进行特征提取,得到所述目标文本在文本维度上的第一特征信息。通过各任务维度上的适配器,基于所述第一特征信息对所述目标文本进行特征提取,得到所述目标文本在各所述任务维度上的第二特征信息,所述目标文本分析模型根据上述一方面所述的文本分析模型的训练方法训练得到。根据所述第一特征信息和所述第二特征信息对所述目标文本进行分析,得到文本分本文档来自技高网...

【技术保护点】

1.一种文本分析模型的训练方法,包括:

2.根据权利要求1所述的方法,所述第一标签信息包括:所述第一样本文本中与指定任务维度对应的样本关键词;

3.根据权利要求2所述的方法,所述在编码器的参数固定的情况下,将第一样本数据集合输入基座模型,对所述第一样本文本进行文本分析,得到第一分析结果,包括:

4.根据权利要求3所述的方法,所述根据所述第一分析结果和所述第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器,包括:

5.根据权利要求2所述的方法,所述基座模型包括多个任务维度分别对应的适配器;

6.根据权利要求5所述的方法,所述第二样本数据集合还包括:各所述任务维度分别对应的任务描述信息;

7.根据权利要求6所述的方法,所述通过所述编码器,在所述文本维度上对所述第二样本文本进行特征提取,得到第三特征信息之后,还包括:

8.根据权利要求5所述的方法,所述根据所述第二分析结果和所述第二标签信息,对所述编码器的参数进行调整,得到目标文本分析模型,包括:

9.根据权利要求6所述的方法,所述根据各所述任务维度分别对应的维度损失函数,确定所述基座模型的模型损失函数,包括:

10.一种文本分析方法,包括:

11.一种文本分析模型的训练装置,包括:

12.一种文本分析装置,包括:

13.一种电子设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:

14.一种电子设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现:

...

【技术特征摘要】

1.一种文本分析模型的训练方法,包括:

2.根据权利要求1所述的方法,所述第一标签信息包括:所述第一样本文本中与指定任务维度对应的样本关键词;

3.根据权利要求2所述的方法,所述在编码器的参数固定的情况下,将第一样本数据集合输入基座模型,对所述第一样本文本进行文本分析,得到第一分析结果,包括:

4.根据权利要求3所述的方法,所述根据所述第一分析结果和所述第一标签信息对待训练的适配器的参数进行调整,得到训练后的适配器,包括:

5.根据权利要求2所述的方法,所述基座模型包括多个任务维度分别对应的适配器;

6.根据权利要求5所述的方法,所述第二样本数据集合还包括:各所述任务维度分别对应的任务描述信息;

7.根据权利要求6所述的方法,所述通过所述编码器,在所述文本维度上对所述第二样本文本进行特征提...

【专利技术属性】
技术研发人员:汪珂航任彦昆杨新星李龙飞
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1