分类模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：41246275 阅读：5 留言：0更新日期：2024-05-09 23:56

本发明专利技术实施例提供了一种分类模型训练方法、装置、电子设备及存储介质，应用于模型训练技术领域。分类模型训练方法包括：获取多个目标文本；获取与预设类别对应的分类提示；将分类提示和目标文本输入文本标注模型得到输出结果；并将一目标类别为预设类别的目标文本和预设类别作为一组训练样本，得到多组训练样本；将训练样本输入初始分类模型，得到与训练样本对应的预测分类结果；计算预测分类结果和训练样本的预设类别之间的损失值，利用损失值更新增量矩阵得到分类模型。利用本发明专利技术实施例提供的分类模型训练方法训练得到的分类模型，可以节省在文本分类所需的计算资源。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模型训练，特别是涉及一种分类模型训练方法、装置、电子设备及存储介质。

技术介绍

1、人们在浏览新闻或观看视频时，常会对新闻或视频中的内容发表一些观点，这些观点通常通过“评论”或“弹幕”的方式对外呈现。然而受主观意识的影响，人们表达的观点并不都是中肯积极的，观点中也常会出现传递负向价值观或不友好概念的负向观点。而这些负向观点的存在会影响用户的浏览体验或观影体验。

2、因此，相关技术中，针对用户发表的观点，通常会结合分类提示，利用闭源大语言模型，例如gpt-4(generative pre-trained transformer 4，生成式预训练转换器4)，对这些观点分类，识别其中的负向观点，避免对其进行显示，以此方式提升用户的浏览体验或观影体验。

3、但是，相关技术的分类方式，由于需要输入较长的分类提示，才能实现准确分类，导致在对实时产生且体量庞大的观点进行分类时，十分耗费计算资源。

技术实现思路

1、本专利技术实施例的目的在于提供一种分类模型训练方法、装置、电子设备及存储介质，以在对文本分类时节省计算资源。具体技术方案如下：

2、在本专利技术实施的第一方面，首先提供了一种分类模型训练方法，所述方法包括：

3、获取多个目标文本；所述多个目标文本包括属于预设类别的预设关键词；

4、获取与所述预设类别对应的分类提示；

5、将所述分类提示和所述目标文本输入文本标注模型，得到所述文本标注模型的输出结果；其中

6、在所述输出结果中，将一所述目标类别为所述预设类别的目标文本和所述预设类别作为一组训练样本，得到多组训练样本；

7、选取所述训练样本重复执行如下步骤，针对选取的任一组训练样本，将所述训练样本输入初始分类模型，得到与所述训练样本对应的预测分类结果；其中，所述初始分类模型中权重矩阵是通用权重矩阵与增量矩阵叠加得到的；所述增量矩阵与所述多个训练样本的类别对应；

8、计算所述预测分类结果和所述训练样本包括的预设类别之间的损失值，利用所述损失值更新所述增量矩阵，直到满足结束条件，得到分类模型。

9、可选地，所述获取多个目标文本，包括：

10、获取多个原始文本；

11、利用预设关键词，对所述多个原始文本进行过滤，保留包括预设关键词的原始文本作为目标文本；所述预设关键词为预设类别的关键词。

12、可选地，所述文本标注模型基于输入的所述分类提示和所述目标文本，预测并标注每一目标文本的目标类别的过程，包括：

13、对所述分类提示和所述目标文本进行分词，得到分词集合；

14、利用所述分词集合中每一分词对应的词向量，生成与所述分类提示和所述目标文本对应的目标矩阵；

15、根据所述目标矩阵预测所述目标文本的属于各类别的置信度；

16、将所述置信度最高的类别作为所述目标文本的目标类别，并对应所述目标文本标注所述目标类别。

17、可选地，所述将所述分类提示和所述目标文本输入文本标注模型之前，所述方法还包括：

18、针对每一所述目标文本，识别所述目标文本中的人物名称；

19、查询所述人物名称指示的人物性别，并在所述目标文本中，利用与人物性别对应的预设标识替换所述人物名称；

20、所述预设类别包括多个子类别；所述多个子类别中包括与人物性别对应的子类别；所述分类提示包括与所述多个子类别分别对应的多个子分类提示；所述多个子分类提示中包括与所述人物性别对应的子类别的子分类提示；所述分类提示还包括所述预设标识与所述人物性别的对应关系；所述将所述分类提示和所述目标文本输入文本标注模型，包括：

21、将所述分类提示和替换后的目标文本输入文本标注模型；所述文本标注模型用于基于各子分类提示、所述预设标识与所述人物性别的对应关系，判断每一所述目标文本是否属于所述与人物性别对应的子类别，若是，则将所述与人物性别对应的子类别作为所述目标文本的目标类别进行标注。

22、可选地，在所述将所述训练样本输入初始分类模型，得到与所述训练样本对应的预测分类结果之前，所述方法还包括：

23、创建与多组训练样本所属预设类别对应的增量矩阵；所述增量矩阵初始为零矩阵；

24、将一通用权重矩阵与所述增量矩阵叠加，得到所述初始分类模型的权重矩阵。

25、可选地，

26、所述获取多个目标文本，包括：

27、获取多个目标弹幕；所述目标弹幕是利用预设通用负向关键词，对多个原始弹幕进行过滤后，得到的包括通用负向关键词的弹幕；

28、获取与所述预设类别对应的分类提示，包括：

29、获取负向语义类别分类提示；所述负向语义类别分类提示包括多个所述负向语义子类别以及每一所述负向语义子类别的子分类提示；

30、所述将所述分类提示和所述目标文本输入文本标注模型，得到所述文本标注模型的输出结果，包括：

31、将所述负向语义类别分类提示和所述多个目标弹幕输入gpt语言模型，得到所述gpt语言模型输出的表单；所述gpt语言模型用于基于所述负向语义类别分类提示和所述目标弹幕，预测所述目标弹幕的目标子类别；所述表单包括多个目标弹幕，以及与每一所述目标弹幕分别对应的目标子类别；

32、所述在所述输出结果中，将一所述目标类别为所述预设类别的目标文本和所述预设类别作为一组训练样本，得到多组训练样本，包括：

33、在所述表单中，选取一所述目标子类别为所述负向语义子类别的目标弹幕，以及所述目标弹幕的负向语义子类别作为一组训练样本，得到多组训练样本。

34、在本专利技术实施的第二方面，提供了一种分类模型训练装置，所述装置包括：

35、第一获取模块，用于获取多个目标文本；所述多个目标文本包括属于预设类别的预设关键词；

36、第二获取模块，用于获取与所述预设类别对应的分类提示；

37、标注模块，用于将所述分类提示和所述目标文本输入文本标注模型，得到所述文本标注模型的输出结果；其中，所述文本标注模型基于输入的所述分类提示和所述目标文本，预测并标注每一目标文本的目标类别；

38、第三获取模块，用于在所述输出结果中，将一所述目标类别为所述预设类别的目标文本和所述预设类别作为一组训练样本，得到多组训练样本；

39、预测模块，用于选取所述训练样本重复执行如下步骤，针对选取的任一组训练样本，将所述训练样本输入初始分类模型，得到与所述训练样本对应的预测分类结果；其中，所述初始分类模型中权重矩阵是通用权重矩阵与增量矩阵叠加得到的；所述增量矩阵与所述多个训练样本的类别对应；

40、更新模块，用于计算所述预测分类结果和所述训练样本包括的预设类别之间的损失值，利用所述损失值更新所述增量矩本文档来自技高网...

【技术保护点】

1.一种分类模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取多个目标文本，包括：

3.根据权利要求1所述的方法，其特征在于，所述文本标注模型基于输入的所述分类提示和所述目标文本，预测并标注每一目标文本的目标类别的过程，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述分类提示和所述目标文本输入文本标注模型之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，在所述将所述训练样本输入初始分类模型，得到与所述训练样本对应的预测分类结果之前，所述方法还包括：

6.根据权利要求1所述的方法，其特征在于，

7.一种分类模型训练装置，其特征在于，所述装置包括：

8.根据权利要求7所述的装置，其特征在于，所述装置还包括：

9.一种电子设备，其特征在于，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质内存储有

...

【技术特征摘要】

1.一种分类模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述获取多个目标文本，包括：

4.根据权利要求1所述的方法，其特征在于，所述将所述分类提示和所述目标文本输入文本标注模型之前，所述方法还包括：

5.根据权利要求1所述的方法，其特征在于，在所述将所述训练样本输入初始分类模型，得到与所述训练样本对应的...

【专利技术属性】
技术研发人员：钱泽，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人