基于隐私保护的大模型微调的方法及装置制造方法及图纸

技术编号：43803901 阅读：0 留言：0更新日期：2024-12-27 13:22

本说明书提供一种基于隐私保护的大模型微调的方法及装置，所述方法包括：第一平台采用差分隐私的方式，利用本地持有的、包括第一领域中隐私数据的目标数据集，训练第一小模型，得到适用于所述第一领域的第二小模型，并将所述第二小模型发送给第二平台；所述第二平台以所述第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，以得到适用于所述第一领域的大模型。

全部详细技术资料下载

【技术实现步骤摘要】

本说明书一个或多个实施例涉及大模型领域，特别涉及一种基于隐私保护的大模型微调的方法及装置。

技术介绍

1、在人工智能领域，大基座模型指的是规模庞大，被设计为可扩展、可适应多种应用场景的基础性模型。这类模型可以视为ai技术栈的基石，其他更专门化的模型或应用可以通过在大基座模型的基础上进行微调(fine-tuning)来快速获得针对特定领域的高性能，而无需从头开始训练大规模模型。大基座模型的一个重要优势在于它们能够促进资源和计算的高效复用，降低下游任务的成本与难度。目前来说，需要一种对大基座模型进行微调的方案。

技术实现思路

1、本说明书一个或多个实施例提供一种基于隐私保护的大模型微调的方法及装置。

2、根据第一方面，提供一种基于隐私保护的大模型微调的方法，所述方法包括：

3、第一平台采用差分隐私的方式，利用本地持有的、包括第一领域中隐私数据的目标数据集，训练第一小模型，得到适用于所述第一领域的第二小模型，并将所述第二小模型发送给第二平台；

4、所述第二平台以所述第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，以得到适用于所述第一领域的大模型。

5、根据第二方面，提供一种基于隐私保护的大模型微调的方法，所述方法由第一平台执行，所述方法包括：

6、获取第一小模型；

7、采用差分隐私的方式，利用本地持有的、包括第一领域中隐私数据的目标数据集，训练第一小模型，得到适用于所述第一领域的第二小模型；p>

8、将所述第二小模型发送给第二平台，使所述第二平台以所述第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，以得到适用于所述第一领域的大模型。

9、根据第三方面，提供一种基于隐私保护的大模型微调的方法，所述方法由第二平台执行，所述方法包括：

10、接收第一平台发送的适用于第一领域的第二小模型；所述第二小模型由所述第一平台采用差分隐私的方式，利用本地持有的、包括第一领域中隐私数据的目标数据集，训练第一小模型而得到；

11、以所述第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，得到适用于所述第一领域的大模型。

12、根据第四方面，提供一种基于隐私保护的大模型微调的装置，所述装置部署于第一平台，所述装置包括：

13、获取模块，用于获取第一小模型；

14、训练模块，用于采用差分隐私的方式，利用本地持有的、包括第一领域中隐私数据的目标数据集，训练第一小模型，得到适用于所述第一领域的第二小模型；

15、发送模块，用于将所述第二小模型发送给第二平台，使所述第二平台以所述第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，以得到适用于所述第一领域的大模型。

16、根据第五方面，提供一种基于隐私保护的大模型微调的装置，所述装置部署于第二平台，所述装置包括：

17、第一接收模块，用于接收第一平台发送的适用于第一领域的第二小模型；所述第二小模型由所述第一平台采用差分隐私的方式，利用本地持有的、包括第一领域中隐私数据的目标数据集，训练第一小模型而得到；

18、蒸馏模块，用于以所述第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，得到适用于所述第一领域的大模型。

19、根据第六方面，提供一种计算机可读存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述第一方面或第二方面或第三方面中任一项所述的方法。

20、根据第七方面，提供一种计算设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现上述第一方面或第二方面或第三方面中任一项所述的方法。

21、本说明书的实施例提供的技术方案可以包括以下有益效果：

22、本说明书的实施例提供的基于隐私保护的大模型微调的方法和装置，通过由第一设备采用差分隐私的方式，利用本地持有的、包括特定领域中隐私数据的目标数据集，训练第一小模型，得到适用于特定领域的第二小模型，并将第二小模型发送给第二设备，由第二设备以第二小模型为老师模型，通过蒸馏学习的方式，对本地持有的大模型进行微调，以得到适用于特定领域的大模型。从而实现了在不泄露隐私数据的前提下，能够利用涉及隐私的训练数据对大模型进行微调，提高了数据的安全性，并保证了对大模型微调的精度。

23、应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

本文档来自技高网...

【技术保护点】

1.一种基于隐私保护的大模型微调的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，所述第一小模型通过以下方式获取：

3.根据权利要求2所述的方法，其中，所述对所述大模型进行压缩处理，得到所述第一小模型，包括：

4.根据权利要求2所述的方法，其中，所述第一小模型的获取还包括：

5.根据权利要求4所述的方法，其中，所述确定所述第一小模型的参数量信息，包括：

6.根据权利要求1所述的方法，其中，所述差分隐私的方式包括以下任意一项：

7.根据权利要求2所述的方法，其中，所述第一小模型中包括多个目标参数；所述训练所述第一小模型包括，将所述第一小模型中的所述目标参数更新为目标数值，以得到所述第二小模型；

8.根据权利要求1所述的方法，其中，所述对大模型进行微调，包括：

9.根据权利要求8所述的方法，其中，所述第一数据基于所述第一领域的提示词而生成。

10.根据权利要求9所述的方法，其中，所述方法还包括：

11.根据权利要求1所述的方法，其中，所述方法还包括，所述第

12.一种基于隐私保护的大模型微调的方法，所述方法由第一平台执行，所述方法包括：

13.根据权利要求12所述的方法，其中，所述获取第一小模型，包括：

14.根据权利要求13所述的方法，其中，所述获取第一小模型，还包括：

15.根据权利要求14所述的方法，其中，所述确定所述第一小模型的参数量信息，包括：

16.根据权利要求12所述的方法，其中，所述差分隐私的方式包括以下任意一项：

17.根据权利要求12所述的方法，其中，所述方法还包括：

18.一种基于隐私保护的大模型微调的方法，所述方法由第二平台执行，所述方法包括：

19.根据权利要求18所述的方法，其中，在接收所述第二小模型之前，所述方法还包括：

20.根据权利要求19所述的方法，其中，所述对所述大模型进行压缩处理，得到所述第一小模型，包括：

21.根据权利要求19所述的方法，其中，在对所述大模型进行压缩处理之前，还包括：

22.根据权利要求19所述的方法，其中，所述第一小模型中包括多个目标参数；所述第二小模型为将所述第一小模型中的所述目标参数更新为目标数值而得到；

23.根据权利要求18所述的方法，其中，所述对大模型进行微调，包括：

24.根据权利要求23所述的方法，其中，所述第一数据基于所述第一领域的提示词而生成；其中，所述方法还包括：

25.根据权利要求18所述的方法，其中，所述方法还包括，从第三平台接收适用于第二领域的第四小模型，以所述第四小模型为老师模型，通过蒸馏学习的方式对所述大模型进行微调，以得到适用于所述第一领域和第二领域的大模型。

26.一种基于隐私保护的大模型微调的装置，所述装置部署于第一平台，所述装置包括：

27.一种基于隐私保护的大模型微调的装置，所述装置部署于第二平台，所述装置包括：

28.一种计算机可读存储介质，其上存储有计算机程序，当所述计算机程序在计算机中执行时，令所述计算机执行权利要求1-25中任一项所述的方法。

29.一种计算设备，包括存储器和处理器，所述存储器中存储有可执行代码，所述处理器执行所述可执行代码时，实现权利要求1-25中任一项所述的方法。

...

【技术特征摘要】