一种多轮对话识别与改写方法、装置及存储介质制造方法及图纸

技术编号：43034241 阅读：20 留言：0更新日期：2024-10-18 17:36

本发明专利技术公开了一种多轮对话识别与改写方法、装置及存储介质，方法包括：获取对话数据集；将所述对话数据集输入到多轮对话识别模型，得到多轮对话识别结果；根据所述对话数据集和所述多轮对话识别结果，进行指代关系识别，得到指代关系识别结果；根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果；其中，所述多轮对话识别模型通过以下步骤得到：获取多轮对话训练集；根据所述多轮对话训练集，对小参数量大模型进行微调处理，得到所述多轮对话识别模型。本发明专利技术实现了多轮对话识别与改写，提高了准确度和效率。本发明专利技术可广泛应用于自然语言处理技术领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及自然语言处理，尤其涉及一种多轮对话识别与改写方法、装置及存储介质。

技术介绍

1、在信息时代，人机交互已经成为人们日常生活和工作中不可或缺的一部分。特别是在智能客服、语音助手等场景中，多轮对话系统的应用广泛。在传统的多轮对话系统中，通过设计一系列的对话流程，根据用户的输入流转到下一步，然后提取上一轮用户问题中的词槽在当前轮对话中进行填充。但是，由于多轮对话中用户问题的成分缺失，导致用户问题语义识别准确度低。此外，使用参数量大的大模型进行用户问题改写，耗时长，效率低。

2、综上，相关技术中存在的技术问题有待得到改善。

技术实现思路

1、本专利技术实施例提供了一种多轮对话识别与改写方法、装置及存储介质，有效地提高了准确度和效率。

2、一方面，本专利技术实施例提供了一种多轮对话识别与改写方法，包括以下步骤：

3、获取对话数据集；

4、将所述对话数据集输入到多轮对话识别模型，得到多轮对话识别结果；

5、根据所述对话数据集和所述多轮对话识别结果，进行指代关系识别，得到指代关系识别结果；

6、根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果；

7、其中，所述多轮对话识别模型通过以下步骤得到：

8、获取多轮对话训练集，所述多轮对话训练集中的数据分类包括：用户问题、多轮对话用户下一轮预测问法、多轮对话改写后用户下一轮预测问法、非多轮对话用户预测问法；

9、根据所述多轮对话训练集，对小参数量大模型进行微调处理，得到所述多轮对话识别模型。

10、在一些实施例中，所述将所述对话数据集输入到多轮对话识别模型，得到多轮对话识别结果，包括：

11、从所述对话数据集中提取上一轮对话内容和所述当前轮用户问题，所述上一轮对话内容包括所述上一轮用户问题和上一轮回答；

12、将所述上一轮对话内容和所述当前轮用户问题输入到多轮对话识别模型，得到所述多轮对话识别结果。

13、在一些实施例中，所述根据所述对话数据集和所述多轮对话识别结果，进行指代关系识别，得到指代关系识别结果，包括：

14、从所述对话数据集中提取所述上一轮用户问题和所述当前轮用户问题；

15、根据所述多轮对话识别结果，采用预设掩码扩大模型对所述上一轮用户问题和所述当前轮用户问题进行指代关系识别，得到所述指代关系识别结果。

16、在一些实施例中，当所述指代关系识别结果为存在指代关系时，所述根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果，包括：

17、根据所述指代关系识别结果，用所述上一轮用户问题中的被指代词替换所述当前轮用户问题中的指代词，得到所述多轮对话改写结果。

18、在一些实施例中，当所述指代关系识别结果为不存在指代关系时，所述根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果，包括：

19、若所述当前轮用户问题缺失主语，则根据所述指代关系识别结果，通过主语继承策略用所述上一轮用户问题中的主语补全所述当前轮用户问题，得到所述多轮对话改写结果；

20、若所述当前轮用户问题缺失谓语，则根据所述指代关系识别结果，通过谓语继承策略用所述上一轮用户问题中的谓语补全所述当前轮用户问题，得到所述多轮对话改写结果。

21、在一些实施例中，所述获取多轮对话训练集，包括：

22、获取人机交互数据；

23、利用大模型对所述人机交互数据进行处理，生成待整理数据；

24、将所述待整理数据中不符合预设要求的数据进行删除，得到所述多轮对话训练集。

25、在一些实施例中，所述根据所述多轮对话训练集，对小参数量大模型进行微调处理，得到所述多轮对话识别模型，包括：

26、根据所述多轮对话训练集、预设输入格式和预设输出格式，构造模型输入；

27、根据所述模型输入，采用预设低阶自适应方式对所述小参数量大模型进行微调；

28、采用预设推理服务库对微调后的所述小参数量大模型进行部署操作，得到所述多轮对话识别模型。

29、另一方面，本专利技术实施例提供了一种多轮对话识别与改写装置，包括：

30、第一模块，用于获取对话数据集；

31、第二模块，用于将所述对话数据集输入到多轮对话识别模型，得到多轮对话识别结果；

32、第三模块，用于根据所述对话数据集和所述多轮对话识别结果，进行指代关系识别，得到指代关系识别结果；

33、第四模块，用于根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果；

34、其中，所述多轮对话识别模型通过以下步骤得到：

35、获取多轮对话训练集，所述多轮对话训练集中的数据分类包括：用户问题、多轮对话用户下一轮预测问法、多轮对话改写后用户下一轮预测问法、非多轮对话用户预测问法；

36、根据所述多轮对话训练集，对小参数量大模型进行微调处理，得到所述多轮对话识别模型。

37、另一方面，本专利技术实施例提供了一种计算机装置，包括：

38、至少一个处理器；

39、至少一个存储器，用于存储至少一个程序；

40、当所述至少一个程序被所述至少一个处理器执行，使得所述至少一个处理器实现所述的方法。

41、另一方面，本专利技术实施例提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现所述的方法。

42、本专利技术所具有的有益效果如下：

43、本专利技术首先获取对话数据集，然后将对话数据集输入到多轮对话识别模型，得到多轮对话识别结果，再根据对话数据集和多轮对话识别结果，进行指代关系识别，得到指代关系识别结果，最后根据指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果，从而实现了多轮对话识别与改写，提高了准确度和效率。其中，多轮对话识别模型是根据多轮对话训练集，对小参数量大模型进行微调处理后得到，从而提高了模型精确度。

44、本专利技术的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在说明书以及附图中所特别指出的结构来实现和获得。

本文档来自技高网...

【技术保护点】

1.一种多轮对话识别与改写方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述将所述对话数据集输入到多轮对话识别模型，得到多轮对话识别结果，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述对话数据集和所述多轮对话识别结果，进行指代关系识别，得到指代关系识别结果，包括：

4.根据权利要求1所述的方法，其特征在于，当所述指代关系识别结果为存在指代关系时，所述根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果，包括：

5.根据权利要求1所述的方法，其特征在于，当所述指代关系识别结果为不存在指代关系时，所述根据所述指代关系识别结果和上一轮用户问题，对当前轮用户问题进行改写，得到多轮对话改写结果，包括：

6.根据权利要求1所述的方法，其特征在于，所述获取多轮对话训练集，包括：

7.根据权利要求1所述的方法，其特征在于，所述根据所述多轮对话训练集，对小参数量大模型进行微调处理，得到所述多轮对话识别模型，包括：

8.一种多轮对话识别

9.一种计算机装置，其特征在于，包括：

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1-7中任一项所述的方法。

...

【技术特征摘要】

1.一种多轮对话识别与改写方法，其特征在于，包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，所述将所述对话数据集输入到多轮对话识别模型，得到多轮对话识别结果，包括：

3.根据权利要求1所述的方法，其特征在于，所述根据所述对话数据集和所述多轮对话识别结果，进行指代关系识别，得到指代关系识别结果，包括：

5.根据权利要求1所述的方法，其特征在于，当所述指代关系识别结果为不存在指代...

【专利技术属性】
技术研发人员：谢金文，林上均，王薇，蒋宇芳，范宜佳，宋云生，
申请(专利权)人：深圳联友科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人