一种模型训练方法、装置和计算机设备制造方法及图纸

技术编号：43876477 阅读：15 留言：0更新日期：2024-12-31 18:59

本申请涉及一种模型训练方法、装置和计算机设备。所述方法包括：获取与目标任务相关的多模态训练样本；多模态训练样本，包括文本、语音和图像中的至少两种样本；目标任务，为视觉处理、语音处理或语言处理中的一种；基于获取到的多模态训练样本，与待训练大模型，构建与目标任务相关的攻防博弈模型；基于攻防博弈模型，剔除多模态训练样本中影响待训练大模型的模型训练收敛速度的目标样本，得到精简后的样本；利用精简后的样本，对待训练大模型进行训练，得到训练后的大模型。采用本方法能够解决了现有的大模型的训练方法，因为存在影响大模型训练效率的样本，导致在进行大模型训练的过程中，存在占用计算资源过多的问题。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及人工智能，特别是涉及一种模型训练方法、装置和计算机设备。

技术介绍

1、随着科技的发展，人工智能技术逐渐受到重视。随着人工智能技术的发展，人工智能技术逐渐应用在自然语言处理、语音处理、以及计算机视觉等多个领域。

2、随着人工智能在各个领域的广泛应用，随之而来的是，对文本、语音或图像等数据的处理量急剧增加。因此，需要引入大数据处理模型，对大量数据进行处理。例如，在进行计算机视觉处理时，需要引入视觉大模型来实现目标功能；在进行自然语言处理时，需要引入语言大模型来实现目标功能；在进行语音处理时，需要引入语言大模型来实现目标功能。然而，为了保证引入的视觉、语言或语音大模型的预测效果，在利用视觉、语言或语音大模型进行计算机视觉或语言处理之前，需要采用大量的图像、文本或语音数据对视觉、语言或语音大模型进行训练。

3、而现有的大模型的训练过程中，因为样本过多，样本参差不齐，存在影响大模型训练效率的样本，导致在进行大模型训练的过程中，需要占用过多的计算资源。

4、针对现有的大模型的训练方法，因为存在影响大模型训练效率的样本，导致在进行大模型训练的过程中，存在占用计算资源过多的问题，目前还没有提出有效的解决方案。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种模型训练方法、装置和计算机设备。

2、第一方面，本申请提供了一种模型训练方法。所述方法包括：

3、获取与目标任务相关的多模态训练样本；所述多模态训练样本，包括文本

4、基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型；

5、基于与所述目标任务相关的所述攻防博弈模型，剔除与所述目标任务相关的所述多模态训练样本中的目标样本，得到精简后的样本；所述目标样本，为影响所述待训练大模型的模型训练收敛速度的样本；

6、利用所述精简后的样本，对与所述目标任务相关的所述待训练大模型进行训练，得到与所述目标相关的训练后的大模型。

7、在其中一个实施例中，所述基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型，包括：

8、基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的所述待训练大模型的训练目标函数，构建与所述目标任务相关的所述攻防博弈模型；所述攻防博弈模型的表达式为：

9、；

10、；

11、；

12、；

13、；

14、；

15、；

16、其中，gk为对与所述目标任务相关的所述待训练大模型的训练的第k步的梯度值，gk-1为对与所述目标任务相关的所述待训练大模型的训练的第k-1步的梯度值，为对与所述目标任务相关的所述待训练大模型的训练的第k步与第k-1步之间的梯度差值，为惩罚因子，x为目标攻击样本，为所述目标攻击样本的扰动值，x´为调整后的目标攻击样本；为阈值因子，j为与所述目标任务相关的所述待训练大模型的训练目标函数，w为与所述目标任务相关的所述待训练大模型的模型参数。

17、在其中一个实施例中，所述基于与所述目标任务相关的所述攻防博弈模型，剔除与所述目标任务相关的所述多模态训练样本中的目标样本，得到精简后的样本，包括：

18、基于与所述目标任务相关的所述攻防博弈模型，确定目标攻击样本；所述目标攻击样本，为在对所述待训练大模型训练时，存在前后两步之间的梯度差值大于或等于预设的梯度差值阈值的情况的样本；

19、基于所述目标攻击样本，剔除与所述目标任务相关的所述多模态训练样本中的所述目标样本，得到所述精简后的样本。

20、在其中一个实施例中，所述基于与所述目标任务相关的所述多模态训练样本中的所述目标攻击样本，剔除与所述目标任务相关的所述多模态训练样本中的所述目标样本，得到所述精简后的样本，包括：

21、基于各个所述目标攻击样本的扰动值，对各个所述目标攻击样本进行调整，得到各个调整后的目标攻击样本；

22、分别计算各个调整后的所述目标攻击样本，与各个所述多模态训练样本之间的相似性，得到各个调整后的所述目标攻击样本，与各个所述多模态训练样本之间的相似性结果；

23、将所述多模态训练样本中，与各个调整后的所述目标攻击样本之间相似性结果大于或等于预设的相似性阈值的样本，作为所述目标样本；

24、从与所述目标任务相关的所述多模态训练样本中，剔除所述目标样本，得到所述精简后的样本。

25、在其中一个实施例中，在基于各个所述目标攻击样本的扰动值，对各个所述目标攻击样本进行调整，得到各个调整后的目标攻击样本之前，包括：

26、计算各个所述目标攻击样本在所述攻防博弈模型中的解，得到各个所述目标攻击样本的扰动值。

27、在其中一个实施例中，在基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型之前，包括：

28、对获取到的与所述目标任务相关的所述多模态训练样本进行数据清洗、归一化或对齐其中的一项或多项处理。

29、在其中一个实施例中，在基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型之前，还包括：

30、基于所述目标任务，确定与所述目标任务相关的所述待训练大模型。

31、在其中一个实施例中，所述基于所述目标任务，确定与所述目标任务相关的所述待训练大模型，包括：

32、基于所述目标任务，确定与所述目标任务相关的所述待训练大模型的模型架构、模型结构和初始化模型参数；

33、基于与所述目标任务相关的所述待训练大模型的所述模型架构、所述模型结构和所述初始化模型参数，确定与所述目标任务相关的所述待训练大模型。

34、第二方面，本申请还提供了一种模型训练装置。所述装置包括：

35、样本获取模块，用于获取与目标任务相关的多模态训练样本；所述多模态训练样本，包括文本、语音和图像中的至少两种样本，其中，所述至少两种样本中，其中一种为与所述目标任务相关的样本种类；所述目标任务，为视觉处理、语音处理或语言处理中的一种；

36、模型确定模块，用于基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型；

37、样本精简模块，用于基于与所述目标任务相关的所述攻防博弈模型，剔除与所述目标任务相关的所述多模态训练样本中本文档来自技高网...

【技术保护点】

1.一种模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型，包括：

3.根据权利要求1所述的模型训练方法，其特征在于，所述基于与所述目标任务相关的所述攻防博弈模型，剔除与所述目标任务相关的所述多模态训练样本中的目标样本，得到精简后的样本，包括：

4.根据权利要求3所述的模型训练方法，其特征在于，所述基于所述目标攻击样本，剔除与所述目标任务相关的所述多模态训练样本中的所述目标样本，得到所述精简后的样本，包括：

5.根据权利要求4所述的模型训练方法，其特征在于，在基于各个所述目标攻击样本的扰动值，对各个所述目标攻击样本进行调整，得到各个调整后的目标攻击样本之前，包括：

6.根据权利要求1所述的模型训练方法，其特征在于，在基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型之前，包括：

7.根据权利要求1所述的模型训练方法，其特征在于，在基于获取到的与所述目标任务相关的所述多模态训练样本，以及与所述目标任务相关的待训练大模型，构建与所述目标任务相关的攻防博弈模型之前，还包括：

8.根据权利要求7所述的模型训练方法，其特征在于，所述基于所述目标任务，确定与所述目标任务相关的所述待训练大模型，包括：

9.一种模型训练装置，其特征在于，所述装置包括：

10.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至权利要求8中任一项所述的模型训练方法的步骤。

...

【技术特征摘要】

1.一种模型训练方法，其特征在于，所述方法包括：

5.根据权利要求4所述的模型训练方法，其特征在于，在基于各个所述目标攻击样本的扰动值，对各个所述目标攻击样本进行调整，得到各个调整后的目标攻击样本之前，包括：<...

【专利技术属性】
技术研发人员：董建敏，彭弘毅，高翔，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人