文本分类模型的训练方法、文本分类方法及相关设备技术

技术编号：41205292 阅读：2 留言：0更新日期：2024-05-07 22:31

本申请提供了一种文本分类模型的训练方法、文本分类方法及相关设备，方法包括：获取多个类别的文本样本；确定目标正样本与第一正样本之间的第一相似度，以及确定目标正样本与第一负样本之间的第二相似度，其中，第一负样本至少包括辅助样本，辅助样本与所对应的正样本的结构相似且意图不同；基于第一相似度和所第二相似度确定第一损失值；将目标正样本输入到待训练的文本分类模型，得到目标正样本的预测标签，基于目标正样本的预测标签和真实标签确定第二损失值；基于第一损失值和第二损失值，更新待训练的文本分类模型的参数，得到训练后的文本分类模型。本申请能够提高文本分类模型的分类准确率。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及自然语言处理技术，尤其涉及一种文本分类模型的训练方法、文本分类方法及相关设备。

技术介绍

1、随着计算机技术的发展，在多个业务应用场景中，需要使用到文本分类模型，以将文本分为多个类型，从而根据文本的类型，确定后续具有针对性的业务执行流程，从而提高业务执行的效率。而相关技术中，文本分类结果准确的率较低，进而影响业务执行的效率，甚至导致业务执行出现错误。

技术实现思路

1、本申请实施例提供一种文本分类模型的训练方法、分类方法、装置、计算机设备、计算机程序产品及计算机可读存储介质，能够提高文本分类准确率。

2、本申请实施例的技术方案是这样实现的：

3、本申请实施例提供一种文本分类模型的训练方法，所述方法包括：

4、获取多个类别的文本样本，其中，每个类别的文本样本包括多个正样本和多个负样本；

5、确定目标正样本与第一正样本之间的第一相似度，以及确定所述目标正样本与第一负样本之间的第二相似度，其中，所述第一负样本至少包括辅助样本，所述辅助样本与所对应的正样本的结构相似且意图不同，所述目标正样本为所述多个类别的文本样本中的任一正样本，所述第一正样本为所述文本样本中与所述目标正样本类别相同的正样本，所述第一负样本为所述文本样本中与所述目标正样本类别不同的负样本；

6、基于所述第一相似度和所述第二相似度确定用于表征对比学习损失的第一损失值；

7、将所述目标正样本输入到待训练的文本分类模型，得到所述目标正样本的预测标签

8、基于所述第一损失值和所述第二损失值，更新所述待训练的文本分类模型的参数，得到训练后的文本分类模型。

9、本申请实施例提供一种文本分类方法，所述方法包括：

10、获取待分类文本；

11、通过所述文本分类模型对所述待分类文本进行处理，得到所述待分类文本的预测标签，其中，所述预测标签表征所述待分类文本的意图，所述文本分类模型基于权利要求1至10任一项所述的文本分类模型的训练方法训练得到。

12、本申请实施例提供一种文本分类模型的训练装置，包括：

13、样本获取模块，用于获取多个类别的文本样本，其中，每个类别的文本样本包括多个正样本和多个负样本；

14、相似度确定模块，用于确定目标正样本与第一正样本之间的第一相似度，以及确定所述目标正样本与第一负样本之间的第二相似度，其中，所述第一负样本至少包括辅助样本，所述辅助样本与所对应的正样本的结构相似且意图不同，所述目标正样本为所述多个类别的文本样本中的任一正样本，所述第一正样本为所述文本样本中与所述目标正样本类别相同的正样本，所述第一负样本为所述文本样本中与所述目标正样本类别不同的负样本；

15、第一损失值确定模块，用于基于所述第一相似度和所述第二相似度确定用于表征对比学习损失的第一损失值；

16、第二损失值确定模块，用于将所述目标正样本输入到待训练的文本分类模型，得到所述目标正样本的预测标签，基于所述目标正样本的预测标签和真实标签确定用于表征分类损失的第二损失值；

17、参数更新模块，用于基于所述第一损失值和所述第二损失值，更新所述待训练的文本分类模型的参数，得到训练后的文本分类模型。

18、本申请实施例提供了一种文本分类装置，所述装置包括：

19、文本获取模块，用于获取待分类文本；

20、文本分类模块，用于通过所述文本分类模型对所述待分类文本进行处理，得到所述待分类文本的预测标签，其中，所述预测标签表征所述待分类文本的意图，所述文本分类模型基于权利要求1至10任一项所述的文本分类模型的训练方法训练得到。

21、本申请实施例提供一种计算机设备，所述计算机设备包括：

22、存储器，用于存储计算机可执行指令；

23、处理器，用于执行所述存储器中存储的计算机可执行指令时，实现本申请实施例提供的方法。

24、本申请实施例提供一种计算机可读存储介质，存储有计算机程序或计算机可执行指令，用于被处理器执行时实现本申请实施例提供的文本分类模型的训练方法，或者实现本申请实施例提供的文本分类方法。

25、本申请实施例提供一种计算机程序产品，包括计算机程序或计算机可执行指令，述计算机程序或计算机可执行指令被处理器执行时，实现本申请实施例提供的文本分类模型的训练方法，或者实现本申请实施例提供的文本分类方法。

26、本申请实施例具有以下有益效果：

27、通过多个正样本以及多个负样本，确定出正样本之间的第一相似度，以及正样本与负样本之间的第二相似度，其中，负样本中至少包括辅助样本(辅助样本为与对应的正样本相似且意图不同的负样本)，进而通过第一相似度和第二相似度确定用于表征对比学习损失的第一损失值，特别是从负样本中定位出辅助样本，使得文本分类模型可以区分出与正样本相似且意图不同的文本，提高文本分类模型区分相似文本的准确率。之后可以通过正样本分别对应的预测标签和真实标签确定用于表征分类损失的第二损失值，从而使得文本分类模型可以区分出类别不同的样本。

本文档来自技高网...

【技术保护点】

1.一种文本分类模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定目标正样本与所述第一正样本之间的第一相似度，包括：

3.根据权利要求2所述的方法，其特征在于，所述文本分类模型包括语义理解层和分类层；所述文本分类模型对所述目标正样本进行处理，得到第一隐状态，包括：

4.根据权利要求2所述的方法，其特征在于，所述文本分类模型包括语义理解层和分类层，所述文本分类模型对所述第一正样本进行处理，得到第二隐状态，包括：

5.根据权利要求1所述的方法，其特征在于，所述确定所述目标正样本与所述第一负样本之间的第二相似度，包括：

6.根据权利要求5所述的方法，其特征在于，所述文本分类模型对所述第一负样本进行处理，得到第一负样本的第三隐状态，包括：

7.根据权利要求1所述的方法，其特征在于，所述基于所述第一相似度和所述第二相似度确定第一损失值，包括：

8.根据权利要求7所述的方法，其特征在于，所述负样本还包括具有多个标签的多标签样本，所述多个标签表征的意图均与所述多标签样

9.根据权利要求1至8任一项所述的方法，其特征在于，所述基于所述第一损失值和所述第二损失值，更新所述文本分类模型的参数，包括：

10.一种文本分类方法，其特征在于，所述方法包括：

11.一种计算机设备，其特征在于，所述计算机设备包括：

12.一种计算机可读存储介质，存储有计算机可执行指令或者计算机程序，其特征在于，所述计算机可执行指令或者计算机程序被处理器执行时实现权利要求1至9任一项所述的文本分类模型的训练方法，或者实现权利要求10所述的文本分类方法。

...

【技术特征摘要】

1.一种文本分类模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述确定目标正样本与所述第一正样本之间的第一相似度，包括：

5.根据权利要求1所述的方法，其特征在于，所述确定所述目标正样本与所述第一负样本之间的第二相似度，包括：

6.根据权利要求5所述的方法，其特征在于，所述文本分类模型对所述第一负样本进行处理，得到第一负样本的第三隐状态，包括：

7.根据权...

【专利技术属性】
技术研发人员：赵宏宇，
申请(专利权)人：马上消费金融股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人