System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 对话辅助方法、设备、存储介质及计算机程序产品技术_技高网

对话辅助方法、设备、存储介质及计算机程序产品技术

技术编号:41902630 阅读:8 留言:0更新日期:2024-07-05 14:08
本申请公开了一种对话辅助方法、设备、存储介质及计算机程序产品,涉及语音处理技术领域,该方法包括:获取实时语音流信息,并将实时语音流信息转换为实时语音文本;根据任务定义标签以及实时语音文本生成数据列表;将数据列表输入至预设多任务大语言模型,预设多任务大语言模型包括共享特征层以及并行线性层;通过共享特征层对数据列表进行嵌入转换以及特征提取,获得特征表达;通过并行线性层对特征表达进行特征整合以及特征映射,获得预设多任务大语言模型输出的对话辅助信息;根据对话辅助信息引导用户与客户进行对话。相较现有方式,能实现一套模型参数完成多个任务生成的目标,使得生成的对话辅助信息内容更丰富,有助于提升对话效率。

【技术实现步骤摘要】

本申请涉及语音处理,尤其涉及一种对话辅助方法、装置、存储介质及计算机程序产品。


技术介绍

1、随着语音识别技术的发展,其应用场景已经从简单的命令执行扩展到更为复杂和多样化的领域,例如基于语音识别技术构建的对话辅助系统可以为用户提供实时的反馈和建议,以辅助用户与客户进行对话沟通。

2、现有方式中使用的对话辅助系统通常是根据不同的业务场景分别训练得到的模型。然而,由于每种业务场景都需要训练一套独立的模型参数,难以实现模型参数的共享和复用,使得模型部署和维护成本高。

3、上述内容仅用于辅助理解本申请的技术方案,并不代表承认上述内容是现有技术。


技术实现思路

1、本申请的主要目的在于提供一种对话辅助方法、设备、存储介质及计算机产品,旨在解决现有的对话辅助方式中需要单独训练不同业务场景对应的模型,模型参数复用困难,进而导致模型部署和维护成本高的技术问题。

2、为实现上述目的,本申请提出一种对话辅助方法,所述对话辅助方法包括:

3、获取实时语音流信息,并将所述实时语音流信息转换为实时语音文本;

4、根据任务定义标签以及所述实时语音文本生成数据列表;

5、将所述数据列表输入至预设多任务大语言模型,所述预设多任务大语言模型包括共享特征层以及并行线性层;

6、通过所述共享特征层对所述数据列表进行嵌入转换以及特征提取,获得特征表达;

7、通过所述并行线性层对所述特征表达进行特征整合以及特征映射,获得所述预设多任务大语言模型输出的对话辅助信息,其中,所述并行线性层包括预设数量个对应所述任务定义标签的线性层;

8、根据所述对话辅助信息引导用户与客户进行对话。

9、在一实施例中,所述根据任务定义标签以及所述实时语音文本生成数据列表的步骤之前,包括:

10、将所述实时语音流信息输入至预设情感识别模型,获得客户情感识别结果;

11、在所述客户情感识别结果为消极情绪类型时,确定所述任务定义标签包括话术生成标签、摘要总结标签以及实时质检标签;

12、或,在所述客户情感识别结果为积极情绪类型时,确定所述任务定义标签包括摘要总结标签以及实时质检标签。

13、在一实施例中,所述将所述实时语音流信息输入至预设情感识别模型,获得客户情感识别结果的步骤,包括:

14、对所述实时语音流信息进行切片,获得若干个语音流片段;

15、将各所述语音流切片输入至所述预设情感识别模型,所述预设情感识别模型包括:预处理模块、声学特征提取模块以及分类模块;

16、通过所述预处理模块对各所述语音流片段进行预处理,获得待识别语音信号;

17、通过所述声学特征提取模块对所述待识别语音信号进行特征提取,获得声学特征;

18、通过所述分类模块对所述声学特征进行特征交互和特征转换,获得所述预设情感识别模型输出的客户情感识别结果。

19、在一实施例中,所述将所述数据列表输入至预设多任务大语言模型的步骤之前,包括:

20、初始化多任务大语言模型;

21、获取历史对话信息,并根据所述历史对话信息构建各语言处理任务对应的任务训练集,所述语言处理任务包括话术生成任务、摘要总结任务以及实时质检任务;

22、采用交替训练策略根据各所述任务训练集对所述多任务大语言模型进行训练,获得预设多任务大语言模型。

23、在一实施例中,所述历史对话信息包括对话语音文本信息和对应的应答文本信息、历史摘要信息以及违规用语信息;

24、所述获取历史对话信息,并根据所述历史对话信息构建各语言处理任务对应的任务训练集的步骤,包括:

25、根据所述对话语音文本信息以及对应的应答文本信息构建所述话术生成任务对应的任务训练集;

26、或,根据所述对话语音文本信息以及对应的历史摘要信息构建所述摘要总结任务对应的任务训练集;

27、或,根据所述对话语音文本信息以及对应的违规用语信息构建所述实时质检任务对应的任务训练集。

28、在一实施例中,所述共享特征层包括:输入层以及编码器;

29、所述通过所述共享特征层对所述数据列表进行嵌入转换以及特征提取,获得特征表达的步骤,包括:

30、通过所述输入层对所述数据列表进行向量转换,获得嵌入向量;

31、通过所述编码器对所述嵌入向量进行特征编码,获得特征表达。

32、在一实施例中,所述通过所述并行线性层对所述特征表达进行特征整合以及特征映射,获得所述预设多任务大语言模型输出的对话辅助信息的步骤,包括:

33、通过各所述任务定义标签的线性层对所述特征表达进行特征整合,获得对应所述任务定义标签的高维特征信息;

34、对所述高维特征信息进行线性映射,获得各所述语言处理任务的模型输出结果,所述模型输出结果包括参考话术信息、实时摘要信息以及实时质检信息;

35、根据所述参考话术信息、实时摘要信息以及实时质检信息确定对话辅助信息。

36、此外,为实现上述目的,本申请还提出一种对话辅助设备,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如上文所述的对话辅助方法的步骤。

37、此外,为实现上述目的,本申请还提出一种存储介质,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上文所述的对话辅助方法的步骤。

38、此外,为实现上述目的,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上文所述的对话辅助方法的步骤。

39、本申请提供一种对话辅助方法,通过获取实时语音流信息,并将所述实时语音流信息转换为实时语音文本;根据任务定义标签以及所述实时语音文本生成数据列表;将所述数据列表输入至预设多任务大语言模型,所述预设多任务大语言模型包括共享特征层以及并行线性层;通过所述共享特征层对所述数据列表进行嵌入转换以及特征提取,获得特征表达;通过所述并行线性层对所述特征表达进行特征整合以及特征映射,获得所述预设多任务大语言模型输出的对话辅助信息,其中,所述并行线性层包括预设数量个对应所述任务定义标签的线性层;根据所述对话辅助信息引导用户与客户进行对话。

40、由于本申请中首先获取实时语音流信息并转化为实时语音文本,接着根据任务定义标签和实时语音文本生成数据列表,再输入至预设多任务大语言模型,相较现有方式中对不同任务场景分别进行模型参数训练,本申请能够实现一套模型参数完成多个任务生成的目标,使得生成的对话辅助信息内容更丰富,进而根据对话辅助信息引导与客户的对话,有助于提升对话效率。

本文档来自技高网...

【技术保护点】

1.一种对话辅助方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据任务定义标签以及所述实时语音文本生成数据列表的步骤之前,包括:

3.如权利要求2所述的方法,其特征在于,所述将所述实时语音流信息输入至预设情感识别模型,获得客户情感识别结果的步骤,包括:

4.如权利要求1所述的方法,其特征在于,所述将所述数据列表输入至预设多任务大语言模型的步骤之前,包括:

5.如权利要求4所述的方法,其特征在于,所述历史对话信息包括对话语音文本信息和对应的应答文本信息、历史摘要信息以及违规用语信息;

6.如权利要求5所述的方法,其特征在于,所述共享特征层包括:输入层以及编码器;

7.如权利要求6所述的方法,其特征在于,所述通过所述并行线性层对所述特征表达进行特征整合以及特征映射,获得所述预设多任务大语言模型输出的对话辅助信息的步骤,包括:

8.一种对话辅助设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序配置为实现如权利要求1至7中任一项所述的对话辅助方法的步骤。

9.一种存储介质,其特征在于,所述存储介质为计算机可读存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的对话辅助方法的步骤。

10.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的对话辅助方法的步骤。

...

【技术特征摘要】

1.一种对话辅助方法,其特征在于,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述根据任务定义标签以及所述实时语音文本生成数据列表的步骤之前,包括:

3.如权利要求2所述的方法,其特征在于,所述将所述实时语音流信息输入至预设情感识别模型,获得客户情感识别结果的步骤,包括:

4.如权利要求1所述的方法,其特征在于,所述将所述数据列表输入至预设多任务大语言模型的步骤之前,包括:

5.如权利要求4所述的方法,其特征在于,所述历史对话信息包括对话语音文本信息和对应的应答文本信息、历史摘要信息以及违规用语信息;

6.如权利要求5所述的方法,其特征在于,所述共享特征层包括:输入层以及编码器;

7.如权利要求6所述的方法,...

【专利技术属性】
技术研发人员:赵俊安刘家豪丘文明庄植雄杨宇驰
申请(专利权)人:中邮消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1