System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对话处理模型训练方法及装置、对话方法及装置制造方法及图纸_技高网

对话处理模型训练方法及装置、对话方法及装置制造方法及图纸

技术编号:43045302 阅读:0 留言:0更新日期:2024-10-22 14:30
本说明书实施例提供对话处理模型训练方法及装置、对话方法及装置,所述对话处理模型训练方法包括:确定与目标对话领域关联的初始对话处理模型;根据初始对话处理模型在目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据,其中,第一对话训练数据包括第一对话训练样本以及正标签,第二对话训练数据包括第二对话训练样本以及负标签;根据初始对话训练数据以及第一对话训练样本,对初始对话处理模型进行训练获得更新对话处理模型;根据第一对话训练样本、正标签、第二对话训练样本及负标签,对更新对话处理模型进行训练获得目标对话处理模型;该方法提高了目标对话处理模型在实际应用中的回答准确性以及回答效果。

【技术实现步骤摘要】

本说明书实施例涉及计算机,特别涉及一种对话处理模型训练方法。本说明书一个或者多个实施例同时涉及一种对话方法,一种对话处理模型训练装置,一种对话装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品。


技术介绍

1、通常,利用特定的项目数据,对预训练对话处理模型进行微调训练,可以使预训练对话处理模型能够拥有特定项目上的对话能力。

2、然而,实际应用中,由于多种实际的原因,例如用户的提问方式繁多、训练数据少等等,导致模型的回答与预期回答差别较大,回答效果较差。

3、因此,亟需一种提高模型回答效果的技术方案以解决上述技术问题。


技术实现思路

1、有鉴于此,本说明书实施例提供了一种对话处理模型训练方法。本说明书一个或者多个实施例同时涉及一种对话方法,一种对话处理模型训练装置,一种对话装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序产品,以解决现有技术中存在回答效果较差的技术缺陷。

2、根据本说明书实施例的第一方面,提供了一种对话处理模型训练方法,包括:

3、确定与目标对话领域关联的初始对话处理模型,其中,所述初始对话处理模型,通过与所述目标对话领域关联的初始对话训练数据,对预训练对话处理模型训练获得;

4、根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据,其中,所述第一对话训练数据包括第一对话训练样本以及所述第一对话训练样本对应的正标签,所述第二对话训练数据包括第二对话训练样本以及所述第二对话训练样本对应的负标签;

5、根据所述初始对话训练数据以及所述第一对话训练样本,对所述初始对话处理模型进行训练,获得更新对话处理模型;

6、根据所述第一对话训练样本、所述正标签、所述第二对话训练样本以及所述负标签,对所述更新对话处理模型进行训练,获得目标对话处理模型。

7、根据本说明书实施例的第二方面,提供了一种对话方法,包括:

8、确定与目标对话领域关联的输入对话数据;

9、将所述输入对话数据输入对话处理模型,获得与所述输入对话数据对应的、与所述目标对话领域关联的输出对话数据,其中,所述对话处理模型根据上述对话处理模型训练方法获得。

10、根据本说明书实施例的第三方面,提供了一种对话处理模型训练装置,包括:

11、初始模型确定模块,被配置为确定与目标对话领域关联的初始对话处理模型,其中,所述初始对话处理模型,通过与所述目标对话领域关联的初始对话训练数据,对预训练对话处理模型训练获得;

12、训练数据确定模块,被配置为根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据,其中,所述第一对话训练数据包括第一对话训练样本以及所述第一对话训练样本对应的正标签,所述第二对话训练数据包括第二对话训练样本以及所述第二对话训练样本对应的负标签;

13、更新模型获得模块,被配置为根据所述初始对话训练数据以及所述第一对话训练样本,对所述初始对话处理模型进行训练,获得更新对话处理模型;

14、目标模型获得模块,被配置为根据所述第一对话训练样本、所述正标签、所述第二对话训练样本以及所述负标签,对所述更新对话处理模型进行训练,获得目标对话处理模型。

15、根据本说明书实施例的第四方面,提供了一种对话装置,包括:

16、输入确定模块,被配置为确定与目标对话领域关联的输入对话数据;

17、输出获得模块,被配置为将所述输入对话数据输入对话处理模型,获得与所述输入对话数据对应的、与所述目标对话领域关联的输出对话数据,其中,所述对话处理模型根据上述对话处理模型训练方法获得。

18、根据本说明书实施例的第五方面,提供了一种计算设备,包括:

19、存储器和处理器;

20、其中,存储器用于存储计算机程序/指令,处理器用于执行计算机程序/指令,该计算机程序/指令被处理器执行时实现上述对话处理模型训练方法或上述对话方法的步骤。

21、根据本说明书实施例的第六方面,提供了一种计算机可读存储介质,其存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现上述对话处理模型训练方法或上述对话方法的步骤。

22、根据本说明书实施例的第七方面,提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述对话处理模型训练方法或上述对话方法的步骤。

23、本说明书一个实施例提供的一种对话处理模型训练方法,根据与目标对话领域关联的初始对话处理模型在该目标对话领域的应用数据,确定与目标对话领域关联性更强的第一对话训练数据和第二对话训练数据,之后,利用对应正标签的第一对话训练数据以及初始对话训练数据再对初始对话处理模型进行训练,通过增加正标签的第一对话训练数据,训练获得更新对话处理模型,相较于初始对话处理模型,增强了初始对话处理模型回答准确答案的能力,进一步的,根据第一对话训练样本、正标签、第二对话训练样本以及负标签,对上述获得的更新对话处理模型进行进一步训练,进一步提高了获得的目标对话处理模型对输入数据的正负判断能力,并进一步提高了目标对话处理模型在实际应用中的回答准确性以及回答效果。

本文档来自技高网...

【技术保护点】

1.一种对话处理模型训练方法,其特征在于,包括:

2.根据权利要求1所述的对话处理模型训练方法,其特征在于,所述根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据之前,还包括:

3.根据权利要求2所述的对话处理模型训练方法,其特征在于,所述部署所述初始对话处理模型,基于所述初始对话处理模型进行对话处理,获得对话数据,包括:

4.根据权利要求1-3任意一项所述的对话处理模型训练方法,其特征在于,所述根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据之前,还包括:

5.根据权利要求4所述的对话处理模型训练方法,其特征在于,所述根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据,包括:

6.根据权利要求5所述的对话处理模型训练方法,其特征在于,所述根据所述目标对话处理任务、以及所述初始对话处理模型在所述目标对话领域的应用数据,确定满足所述模型训练数据量的总对话训练数据,包括:

7.根据权利要求6所述的对话处理模型训练方法,其特征在于,所述从所述初始对话训练数据中,选择满足所述模型训练数据量的总对话训练数据,包括:

8.根据权利要求6所述的对话处理模型训练方法,其特征在于,所述根据所述目标对话处理任务,从所述初始对话处理模型在所述目标对话领域的应用数据中,筛选出初始对话训练数据之后,还包括:

9.根据权利要求5所述的对话处理模型训练方法,其特征在于,所述根据所述总对话训练数据,确定所述第一对话训练数据以及所述第二对话训练数据,包括:

10.根据权利要求9所述的对话处理模型训练方法,其特征在于,所述根据所述总对话训练数据,确定所述第一对话训练数据以及所述第二对话训练数据之前,还包括:

11.根据权利要求10所述的对话处理模型训练方法,其特征在于,所述根据所述第一数据量与所述第一样本数量的匹配关系、以及所述第二数据量与所述第二样本数量的匹配关系,调整所述第一对话训练数据以及所述第二对话训练数据,包括:

12.根据权利要求1所述的对话处理模型训练方法,其特征在于,所述确定与目标对话领域关联的初始对话处理模型,包括:

13.一种对话方法,其特征在于,包括:

14.根据权利要求13所述的对话方法,其特征在于,所述将所述输入对话数据输入对话处理模型,获得与所述输入对话数据对应的、与所述目标对话领域关联的输出对话数据,包括:

15.根据权利要求13所述的对话方法,其特征在于,所述确定与目标对话领域关联的输入对话数据,包括:

16.一种对话处理模型训练装置,其特征在于,包括:

17.一种对话装置,其特征在于,包括:

18.一种计算设备,其特征在于,包括:

19.一种计算机可读存储介质,其特征在于,其存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1-12任意一项所述对话处理模型训练方法或者权利要求13-15任意一项所述对话方法的步骤。

20.一种计算机程序产品,其特征在于,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现权利要求1-12任意一项所述对话处理模型训练方法或者权利要求13-15任意一项所述对话方法的步骤。

...

【技术特征摘要】

1.一种对话处理模型训练方法,其特征在于,包括:

2.根据权利要求1所述的对话处理模型训练方法,其特征在于,所述根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据之前,还包括:

3.根据权利要求2所述的对话处理模型训练方法,其特征在于,所述部署所述初始对话处理模型,基于所述初始对话处理模型进行对话处理,获得对话数据,包括:

4.根据权利要求1-3任意一项所述的对话处理模型训练方法,其特征在于,所述根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据之前,还包括:

5.根据权利要求4所述的对话处理模型训练方法,其特征在于,所述根据所述初始对话处理模型在所述目标对话领域的应用数据,确定第一对话训练数据以及第二对话训练数据,包括:

6.根据权利要求5所述的对话处理模型训练方法,其特征在于,所述根据所述目标对话处理任务、以及所述初始对话处理模型在所述目标对话领域的应用数据,确定满足所述模型训练数据量的总对话训练数据,包括:

7.根据权利要求6所述的对话处理模型训练方法,其特征在于,所述从所述初始对话训练数据中,选择满足所述模型训练数据量的总对话训练数据,包括:

8.根据权利要求6所述的对话处理模型训练方法,其特征在于,所述根据所述目标对话处理任务,从所述初始对话处理模型在所述目标对话领域的应用数据中,筛选出初始对话训练数据之后,还包括:

9.根据权利要求5所述的对话处理模型训练方法,其特征在于,所述根据所述总对话训练数据,确定所述第一对话训练数据以及所述第二对话训练数据...

【专利技术属性】
技术研发人员:王子和王乐朱珊珊李文雅何舒宁柳景明
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1