System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 意图识别方法、装置、电子设备和计算机可读存储介质制造方法及图纸_技高网

意图识别方法、装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:43660281 阅读:6 留言:0更新日期:2024-12-13 12:51
本发明专利技术实施例公开了一种意图识别方法、装置、电子设备和计算机可读存储介质,所述方法包括获取训练数据和聚类数据,根据所述训练数据对预训练语言模型进行对比学习训练,确定句向量模型,将所述聚类数据输入至所述句向量模型,确定对应的句向量,将所述句向量分别输入至各初始参数组合对应的聚类模型进行聚类,以根据各聚类结果确定最佳参数组合,根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别。由此,通过对比学习训练确定句向量模型以及根据不同初始参数组合对应的聚类结果确定聚类的最佳参数组合和对应的意图类别,能够提高新意图识别的准确性。

【技术实现步骤摘要】

本专利技术涉及计算机,具体涉及一种意图识别方法、装置、电子设备和计算机可读存储介质


技术介绍

1、不同业务场景下会提供有相应的对话任务系统,以打车场景下的智能客服系统为例,用户将使用服务时产生的问题输入至智能客服系统进行咨询,系统对用户问题进行识别后确定用户意图并根据用户意图给出相应的回复。因此,在智能客服系统使用之前,需要对用户提出的问题按照类别进行划分,并作为意图数据提供给系统进行模型训练,以提高系统识别不同用户意图的能力,为用户带来更好的使用体验。

2、现有的新意图识别方法主要使用向量化工具对用户的问题进行向量化,再使用传统的机器学习聚类算法对用户的问题进行聚类。但是,由于使用向量化工具对用户问题进行向量化时,会存在相似意图的用户问句在该向量空间中相距较远或不相似意图的用户问句在该向量空间中相距较近的情况,这就给之后的聚类带来误差,或者在模型本身存在局限性时也会造成意图识别的效果不理想。例如,以传统的机器学习模型k-means进行聚类为例,该模型适用于各聚类簇呈团状分布的数据,而通过向量化工具获取到的问句向量中,往往不具备聚类簇呈团状分布的特点。


技术实现思路

1、有鉴于此,本专利技术实施例旨在提供一种意图识别方法、装置、电子设备和计算机可读存储介质,以提高新意图识别的准确性。

2、第一方面,本专利技术实施例旨在提供一种意图识别方法,所述方法包括:

3、获取训练数据和聚类数据,所述训练数据包括用户语句和对话语句,所述聚类数据包括用户语句;

4、根据所述训练数据对预训练语言模型进行对比学习训练,确定句向量模型;

5、将所述聚类数据输入至所述句向量模型,确定对应的句向量;

6、将所述句向量分别输入至各初始参数组合对应的聚类模型进行聚类,以根据各聚类结果确定最佳参数组合;

7、根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别。

8、进一步地,所述各初始参数组合基于以下步骤确定:

9、依次遍历各聚类参数对应的参数空间,确定各初始参数组合,所述参数空间包括对应聚类参数的至少一个可选值。

10、进一步地,所述聚类结果包括异常值样本点、有效样本点和类别数,所述根据各所述聚类结果确定最佳参数组合包括:

11、基于预设的筛选规则和各初始参数组合对应的聚类结果对所述各初始参数组合进行筛选,确定至少一个候选参数组合;

12、将类别数量最多的聚类结果对应的候选参数组合确定为所述最佳参数组合。

13、进一步地,所述筛选规则用于筛选掉类别数小于预定数量的聚类结果对应的初始参数组合、类别数与聚类数据数量的比值大于预设比值的聚类结果对应的初始参数组合、和/或有效样本点数量在聚类数据中的占比不在预设比重区间中的聚类结果对应的初始参数组合。

14、进一步地,所述根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别包括:

15、将所述聚类数据对应的句向量输入至最佳参数组合下的聚类模型进行聚类,以确定聚类结果对应的至少一个初始簇中心点;

16、根据预设规则对所述聚类数据进行预处理,生成意图数据,所述预处理包括数据增强和数据扩增;

17、根据所述意图数据对应的句向量对各所述初始簇中心点进行优化,确定对应的类别簇中心点;

18、根据各所述类别簇中心点和对应的用户语句确定意图类别。

19、进一步地,所述获取训练数据和聚类数据包括:

20、获取历史对话数据;

21、对所述历史对话数据进行预处理,以从预处理后的历史对话数据中确定训练数据和聚类数据。

22、进一步地,所述根据所述训练数据对预训练语言模型进行对比学习训练,确定句向量模型包括:

23、根据所述训练数据构建正样本对和负样本对,所述正样本对为同一条训练数据中具有上下文关系的用户语句和对话语句,所述负样本对为不具有上下文关系的用户语句和/或对话语句;

24、根据所述正样本对和负样本对确定预训练语言模型对应的损失函数;

25、根据所述正样本对、负样本对和损失函数对预训练语言模型进行对比学习训练,以确定句向量模型。

26、进一步地,所述将所述聚类数据输入至所述句向量模型,确定对应的句向量包括:

27、将所述聚类数据输入至所述句向量模型进行处理;

28、对所述句向量模型最后一层对应的所有向量进行取平均操作,以确定对应的句向量。

29、进一步地,所述方法还包括:

30、将所述意图类别保存入库,以根据所述意图类别输出对应的对话数据。

31、进一步地,所述方法还包括:

32、将所述意图类别与已有的意图类别进行相似度检验,确定新增意图类别;

33、将所述新增意图类别保存入库,以根据所述新增意图类别和已有的意图类别输出对应的对话数据。

34、第二方面,本专利技术实施例旨在提供一种意图识别装置,所述装置包括:

35、数据获取单元,用于获取训练数据和聚类数据,所述训练数据包括用户语句和对话语句,所述聚类数据包括用户语句;

36、模型确定单元,用于根据所述训练数据对预训练语言模型进行对比学习训练,确定句向量模型;

37、向量确定单元,用于将所述聚类数据输入至所述句向量模型,确定对应的句向量;

38、参数确定单元,用于将所述句向量分别输入至各初始参数组合对应的聚类模型进行聚类,以根据各聚类结果确定最佳参数组合;

39、类别确定单元,用于根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别。

40、第三方面,本专利技术实施例旨在提供一种计算机程序产品,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现如上任一项所述的方法。

41、第四方面,本专利技术实施例旨在提供一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如上任一项所述的方法。

42、第五方面,本专利技术实施例旨在提供一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的方法步骤。

43、本专利技术实施例的技术方案通过获取训练数据和聚类数据,根据所述训练数据对预训练语言模型进行对比学习训练,确定句向量模型,将所述聚类数据输入至所述句向量模型,确定对应的句向量,将所述句向量分别输入至各初始参数组合对应的聚类模型进行聚类,以根据各聚类结果确定最佳参数组合,根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别。由此,通过对比学习训练确定句向量模型以及根据不同初始参数组合对应的聚类结果确定聚类的最佳参数组合和对应的意图类别,能够提高新意图识别的准确性。

本文档来自技高网...

【技术保护点】

1.一种意图识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始参数组合基于以下步骤确定:

3.根据权利要求1所述的方法,其特征在于,所述聚类结果包括异常值样本点、有效样本点和类别数,所述根据各所述聚类结果确定最佳参数组合包括:

4.根据权利要求3所述的方法,其特征在于,所述筛选规则用于筛选掉类别数小于预定数量的聚类结果对应的初始参数组合、类别数与聚类数据数量的比值大于预设比值的聚类结果对应的初始参数组合、和/或有效样本点数量在聚类数据中的占比不在预设比重区间中的聚类结果对应的初始参数组合。

5.根据权利要求1所述的方法,其特征在于,所述根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别包括:

6.根据权利要求1所述的方法,其特征在于,所述获取训练数据和聚类数据包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述训练数据对预训练语言模型进行对比学习训练,确定句向量模型包括:

8.根据权利要求1所述的方法,其特征在于,所述将所述聚类数据输入至所述句向量模型,确定对应的句向量包括:

9.根据权利要求1所述的方法,其特征在于,所述方法还包括:

10.根据权利要求1所述的方法,其特征在于,所述方法还包括:

11.一种意图识别装置,其特征在于,所述装置包括:

12.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序/指令,所述计算机程序/指令被处理器执行时实现权利要求1-10中任一项所述的方法。

13.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现权利要求1-10中任一项所述的方法。

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1-10中任一项所述的方法步骤。

...

【技术特征摘要】

1.一种意图识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述初始参数组合基于以下步骤确定:

3.根据权利要求1所述的方法,其特征在于,所述聚类结果包括异常值样本点、有效样本点和类别数,所述根据各所述聚类结果确定最佳参数组合包括:

4.根据权利要求3所述的方法,其特征在于,所述筛选规则用于筛选掉类别数小于预定数量的聚类结果对应的初始参数组合、类别数与聚类数据数量的比值大于预设比值的聚类结果对应的初始参数组合、和/或有效样本点数量在聚类数据中的占比不在预设比重区间中的聚类结果对应的初始参数组合。

5.根据权利要求1所述的方法,其特征在于,所述根据所述聚类数据和最佳参数组合下的聚类模型的聚类结果确定意图类别包括:

6.根据权利要求1所述的方法,其特征在于,所述获取训练数据和聚类数据包括:

7.根据权利要求1所述的方法,其特征在于,所述根据所述训练数据对预训练语言模型进行对比学习训...

【专利技术属性】
技术研发人员:高梽强王婷婷刘浩
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1