质量评估模型的训练方法、多轮对话质量评估方法和装置制造方法及图纸

技术编号：40421270 阅读：11 留言：0更新日期：2024-02-20 22:40

本公开提出了一种质量评估模型的训练方法、多轮对话质量评估方法和装置，涉及自然语言处理和深度学习等人工智能领域，包括：获取初始质量评估模型并对初始质量评估模型进行模型训练，得到训练好的候选质量评估模型；对第一样本多轮对话进行标注得到样本标注向量集合；根据样本标注向量集合对候选质量评估模型进行训练，得到训练好的目标质量评估模型。优化了候选质量评估模型对第一样本多轮对话的语义学习效果，提高了候选质量评估模型对于第一样本多轮对话的质量评估能力，提高了多轮对话的质量评估效率和精度，相较于依赖于人工实现的多轮对话的质量评估，降低了人工依赖程度和人工成本，并为下游任务提供了准确的数据支撑。

全部详细技术资料下载

【技术实现步骤摘要】

本公开涉及数据处理领域，尤其涉及自然语言处理和深度学习等人工智能领域。

技术介绍

1、随着技术的发展，对话服务成为热门的应用，其中，用户可以通过真人多轮对话获取所需的信息，在该场景下，可以对多轮对话进行质量评估，从而对多轮对话所提供的服务的质量进行衡量。

2、相关技术中，可以通过人工对多轮对话的质量进行评估，通过人工对多轮对话中答案的正确性专业性等相关参数进行评估，从而实现对多轮对话的质量评估，人工成本高。

技术实现思路

1、本公开提出了一种质量评估模型的训练方法、多轮对话质量评估方法和装置。

2、根据本公开的第一方面，提出了一种质量评估模型的训练方法，方法包括：获取待训练的初始质量评估模型，并对所述初始质量评估模型进行模型训练，得到训练好的候选质量评估模型；获取第一样本多轮对话并对所述第一样本多轮对话进行标注，得到所述第一样本多轮对话的样本标注向量集合；根据所述样本标注向量集合对所述候选质量评估模型进行训练，直至训练结束，得到训练好的目标质量评估模型。

3、根据本公开的第二方面，提出了一种多轮对话质量评估方法，方法包括：获取训练好的目标多轮对话质量评估模型，其中，所述目标多轮对话质量评估模型通过上述第一方面提出的质量评估模型的训练方法得到；获取待评估的多轮对话，并将所述多轮对话输入所述目标多轮对话质量评估模型，得到所述目标多轮对话质量评估模型输出的质量评估结果。

4、根据本公开的第三方面，提出了一种质量评估模型的训练装置，装置包括：

5、根据本公开的第四方面，提出了一种多轮对话质量评估装置，装置包括：第二获取模块，用于获取训练好的目标多轮对话质量评估模型，其中，所述目标多轮对话质量评估模型通过上述第三方面提出的质量评估模型的训练装置得到；评估模块，用于获取待评估的多轮对话，并将所述多轮对话输入所述目标多轮对话质量评估模型，得到所述目标多轮对话质量评估模型输出的质量评估结果。

6、根据本公开的第五方面，提出了一种电子设备，包括：至少一个处理器；以及与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述第一方面提出的质量评估模型的训练方法和/或第二方面提出的多轮对话质量评估方法。

7、根据本公开的第六方面，提出了一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行上述第一方面提出的质量评估模型的训练方法和/或第二方面提出的多轮对话质量评估方法。

8、根据本公开的第七方面，提出了一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现上述第一方面提出的质量评估模型的训练方法和/或第二方面提出的多轮对话质量评估方法。

9、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

本文档来自技高网...

【技术保护点】

1.一种质量评估模型的训练方法，其中，所述方法包括：

2.根据权利要求1所述的方法，其中，所述获取第一样本多轮对话并对所述第一样本多轮对话进行标注，得到所述第一样本多轮对话的样本标注向量，包括：

3.根据权利要求2所述的方法，其中，所述获取所述第一样本多轮对话中的问题文本和所述问题文本的第一归结信息，包括：

4.根据权利要求2所述的方法，其中，所述获取所述第一样本多轮对话中的回答文本和所述问答文本的第二归结信息，包括：

5.根据权利要求2所述的方法，其中，所述对所述问题文本、所述回答文本、所述第一归结信息和所述第二归结信息进行拼接，得到所述第一样本多轮对话的第一样本标注向量，包括：

6.根据权利要求5所述的方法，其中，所述基于所述第一标注符号、所述第二标注符号和所述第三标注符号，对所述问题文本、所述回答文本、所述第一归结信息和所述第二归结信息进行拼接，得到所述第一样本多轮对话的第一样本标注向量，包括：

7.根据权利要求6所述的方法，其中，所述方法还包括：

8.根据权利要求2所述的方法，其中，所述对

9.根据权利要求8所述的方法，其中，所述根据所述第一区域标注值、所述第二区域标注值和所述第三区域标注值对所述第一样本标注向量进行编码，得到所述第二样本标注向量，包括：

10.根据权利要求2所述的方法，其中，所述对所述第一样本标注向量进行标注，得到所述第一样本标注向量的第二样本标注向量，包括：

11.根据权利要求10所述的方法，其中，所述根据所述词元顺序对各词元的词元位置按序编码，得到所述第二样本标注向量，包括：

12.根据权利要求2所述的方法，其中，所述对所述第一样本标注向量进行标注，得到所述第一样本标注向量的第二样本标注向量，包括：

13.根据权利要求12所述的方法，其中，所述根据所述第一角色标注值、所述第二角色标注值和所述第三角色标注值，对所述第一样本标注向量进行编码，得到所述第二样本标注向量，包括：

14.根据权利要求1所述的方法，其中，所述根据所述样本标注向量集合对所述候选质量评估模型进行训练，直至训练结束，得到训练好的目标质量评估模型，包括：

15.根据权利要求1所述的方法，其中，所述获取待训练的初始质量评估模型，并对所述初始质量评估模型进行模型训练，得到训练好的候选质量评估模型，包括：

16.一种多轮对话质量评估方法，其中，所述方法包括：

17.一种质量评估模型的训练装置，其中，所述装置包括：

18.根据权利要求17所述的装置，其中，所述第一获取模块，还用于：

19.根据权利要求18所述的装置，其中，所述第一获取模块，还用于：

20.根据权利要求18所述的装置，其中，所述第一获取模块，还用于：

21.根据权利要求18所述的装置，其中，所述第一获取模块，还用于：

22.根据权利要求21所述的装置，其中，所述第一获取模块，还用于：

23.根据权利要求22所述的装置，其中，所述第一获取模块，还用于：

24.根据权利要求18所述的装置，其中，所述第一获取模块，还用于：

25.根据权利要求24所述的装置，其中，所述第一获取模块，还用于：

26.根据权利要求18所述的装置，其中，所述第一获取模块，还用于：

27.根据权利要求26所述的装置，其中，所述第一获取模块，还用于：

28.根据权利要求18所述的装置，其中，所述第一获取模块，还用于：

29.根据权利要求28所述的装置，其中，所述第一获取模块，还用于：

30.根据权利要求17所述的装置，其中，所述第二训练模块，还用于：

31.根据权利要求17所述的装置，其中，所述第一训练模块，还用于：

32.一种多轮对话质量评估装置，其中，所述装置包括：

33.一种电子设备，包括：

34.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-15和/或权利要求16中任一项所述的方法。

35.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-15和/或权利要求16中任一项所述的方法。

...

【技术特征摘要】

1.一种质量评估模型的训练方法，其中，所述方法包括：

3.根据权利要求2所述的方法，其中，所述获取所述第一样本多轮对话中的问题文本和所述问题文本的第一归结信息，包括：

4.根据权利要求2所述的方法，其中，所述获取所述第一样本多轮对话中的回答文本和所述问答文本的第二归结信息，包括：

7.根据权利要求6所述的方法，其中，所述方法还包括：

8.根据权利要求2所述的方法，其中，所述对所述第一样本标注向量进行标注，得到所述第一样本标注向量的第二样本标注向量，包括：

10.根据权利要求2所述的方法，其中，所述对所述第一样本标注向量进行标注，得到所述第一样本标注向量的第二样本标注向量，包括：

11.根据权利要求10所述的方法，其中，所述根据所述词元顺序对各词元的词元位置按序编码，得到所述第二样本标注向量，包括：

12.根据权利要求2所述的方法，其中，所述对所述第一样本标注向量进行标注，得到所述第一样本标注向量的第二样本标注向量，包括：

14.根据权利要求1所述的方法，其中，所述根据所述样本标注向...

【专利技术属性】
技术研发人员：赵珊珊，李鸿宇，赵玉琨，邢国亮，程智聪，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人