意图识别模型训练方法、保险文本意图识别方法和装置制造方法及图纸

技术编号：40677237 阅读：5 留言：0更新日期：2024-03-18 19:15

本申请涉及一种意图识别模型训练方法、保险文本意图识别方法、装置、设备和存储介质，能够提高对保险领域文本信息的意图识别准确性。所述方法包括：获取保险文本训练样本；获取教师模型针对所述保险文本训练样本输出的第一文本意图概率分布；将所述保险文本训练样本输入到待训练的学生模型，得到所述学生模型输出的第二文本意图概率分布；根据所述第一文本意图概率分布和所述第二文本意图概率分布之间的差异，确定模型损失值，并根据所述模型损失值调整所述学生模型的模型参数，直到满足训练结束条件，得到训练好的意图识别模型。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及保险文本处理，特别是涉及一种意图识别模型训练方法、保险文本意图识别方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

1、随着计算机技术发展，保险领域中文本信息数量不断增长，存在海量数据亟待处理和解析，以了解保险用户的意图和需求。

2、在相关技术中，可以通过训练意图识别模型分析保险文本，确定用户意图。在训练时，可以采用机器学习或深度学习技术来处理用户数据并识别用户意图，具体而言，可以将样本输入到未经预训练的神经网络，并确定神经网络输出的预测值与预先设定的作为训练标签的真实值之间的差距，然后根据差距调整未经预训练的神经网络的网络参数，以使模型输出的预测值接近真实值。

3、然而，保险领域中文本信息往往包含复杂的语义关系和专业性知识，上述方式训练得到的意图识别模型往往难以全面地确定出文本信息的意图，对保险领域中文本信息的意图识别准确性有待提升。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种能够提高对保险领域文本信息的意图识别准确性的意图识别模型训练方法、保险文本意图识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本申请提供了一种意图识别模型训练方法，包括：

3、获取保险文本训练样本；

4、获取教师模型针对所述保险文本训练样本输出的第一文本意图概率分布；

5、将所述保险文本训练样本输入到待训练的学生模型，得到所述学生模型输出的第二文本意图概率分布；>

6、根据所述第一文本意图概率分布和所述第二文本意图概率分布之间的差异，确定模型损失值，并根据所述模型损失值调整所述学生模型的模型参数，直到满足训练结束条件，得到训练好的意图识别模型。

7、在其中一个实施例中，所述获取保险文本训练样本，包括：

8、获取第一保险文本训练样本，将多个所述第一保险文本训练样本输入到训练好的教师模型，得到各所述第一保险文本训练样本的文本意图预测结果，并确定所述文本意图预测结果的置信度；

9、根据对应置信度大于阈值的第一保险文本训练样本，以及用于训练教师模型的第二保险文本训练样本，得到保险文本训练样本。

10、在其中一个实施例中，所述教师模型通过如下步骤训练得到：

11、获取待训练的教师模型；所述待训练的教师模型包括文本分类模块，以及基于无标注语料预训练得到的语义提取模块；

12、将第二保险文本训练样本输入到所述教师模型，由所述语义提取模块获取所述第二保险文本训练样本的文本语义信息，由所述文本分类模块根据所述文本语义信息获取预测文本意图；

13、根据所述预测文本意图和预设的文本意图标签的差异，调整所述教师模型的模型参数，直到满足训练结束条件，得到训练好的教师模型。

14、在其中一个实施例中，所述将第二保险文本训练样本输入到所述教师模型，包括：

15、将第二保险文本训练样本输入到分词器，由所述分词器对所述第二保险文本训练样本进行分词处理，并根据预设的映射关系确定每个分词对应的分词编码；

16、将由各所述分词编码组成的分词编码序列输入到所述教师模型。

17、在其中一个实施例中，所述将所述保险文本训练样本输入到待训练的学生模型，包括：

18、将所述保险文本训练样本输入到词嵌入模型，由所述词嵌入模型根据预先确定的词嵌入矩阵，得到所述保险文本训练样本中各分词的词向量；

19、将由各所述词向量组成的词向量序列输入到待训练的学生模型。

20、在其中一个实施例中，在所述得到训练好的意图识别模型之后，还包括：

21、获取训练好的意图识别模型的模型结构信息和模型参数；

22、根据所述模型结构信息和模型参数生成所述意图识别模型对应的模型描述文件；

23、将所述模型描述文件部署到保险问答系统；所述保险问答系统用于根据所述模型描述文件运行所述意图识别模型。

24、第二方面，本申请还提供了一种保险文本的意图识别方法，包括：

25、获取保险文本；

26、将所述保险文本输入到训练好的意图识别模型，根据所述意图识别模型的输出结果，确定所述保险文本对应的文本意图；

27、其中，所述意图识别模型根据如上任一项所述的意图识别模型训练方法获取到。

28、第三方面，本申请还提供了一种意图识别模型训练装置，包括：

29、样本获取模块，用于获取保险文本训练样本；

30、第一概率分布获取模块，用于获取教师模型针对所述保险文本训练样本输出的第一文本意图概率分布；

31、第二概率分布获取模块，用于将所述保险文本训练样本输入到待训练的学生模型，得到所述学生模型输出的第二文本意图概率分布；

32、参数调整模块，用于根据所述第一文本意图概率分布和所述第二文本意图概率分布之间的差异，确定模型损失值，并根据所述模型损失值调整所述学生模型的模型参数，直到满足训练结束条件，得到训练好的意图识别模型。

33、第四方面，本申请还提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述的意图识别模型训练方法或保险文本意图识别方法的步骤。

34、第五方面，本申请还提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现任一项所述的意图识别模型训练方法或保险文本意图识别方法的步骤。

35、第六方面，本申请还提供了一种计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现任一项所述的意图识别模型训练方法或保险文本意图识别方法的步骤。

36、上述意图识别模型训练方法、保险文本意图识别方法、装置、计算机设备、存储介质和计算机程序产品，获取保险文本训练样本，然后获取教师模型针对保险文本训练样本输出的第一文本意图概率分布，以及，将保险文本训练样本输入到待训练的学生模型，得到学生模型输出的第二文本意图概率分布，进而可以根据第一文本意图概率分布和第二文本意图概率分布之间的差异，确定模型损失值，并根据模型损失值调整所述学生模型的模型参数，直到满足训练结束条件，得到训练好的意图识别模型。本申请中，一方面，通过获取教师模型和学生模型输出的文本意图概率分布，能够全面地确定保险文本的意图分布情况，避免遗漏保险文本中复杂多样的语义信息；另一方面，通过将第二文本意图概率分布与第一文本意图概率分布进行比对，能够实现对保险文本意图识别的知识蒸馏，避免由未经预训练的神经网络直接进行特征提取而导致无法进行完整的特征感知，有效提升保险领域中文本信息的意图识别准确性。

本文档来自技高网...

【技术保护点】

1.一种意图识别模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取保险文本训练样本，包括：

3.根据权利要求1所述的方法，其特征在于，所述教师模型通过如下步骤训练得到：

4.根据权利要求3所述的方法，其特征在于，所述将第二保险文本训练样本输入到所述教师模型，包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述保险文本训练样本输入到待训练的学生模型，包括：

6.根据权利要求1至5中任一项所述的方法，其特征在于，在所述得到训练好的意图识别模型之后，还包括：

7.一种保险文本的意图识别方法，其特征在于，所述方法包括：

8.一种意图识别模型训练装置，其特征在于，所述装置包括：

9.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的意图识别模型训练方法或权利要求7所述的保险文本意图识别方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序

...

【技术特征摘要】

1.一种意图识别模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取保险文本训练样本，包括：

3.根据权利要求1所述的方法，其特征在于，所述教师模型通过如下步骤训练得到：

4.根据权利要求3所述的方法，其特征在于，所述将第二保险文本训练样本输入到所述教师模型，包括：

5.根据权利要求4所述的方法，其特征在于，所述将所述保险文本训练样本输入到待训练的学生模型，包括：

6.根据权利要求1至5中任一项所述的方法，其特征在于，在所述得到训练好的意图识别模型之后，还包括：<...

【专利技术属性】
技术研发人员：罗世杰，胡翔，
申请(专利权)人：中国人寿保险股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人