System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本说明书一个或多个实施例涉及大模型领域,特别涉及一种基于隐私保护的大模型微调的方法及装置。
技术介绍
1、在人工智能领域,大基座模型指的是规模庞大,被设计为可扩展、可适应多种应用场景的基础性模型。这类模型可以视为ai技术栈的基石,其他更专门化的模型或应用可以通过在大基座模型的基础上进行微调(fine-tuning)来快速获得针对特定领域的高性能,而无需从头开始训练大规模模型。大基座模型的一个重要优势在于它们能够促进资源和计算的高效复用,降低下游任务的成本与难度。目前来说,需要一种对大基座模型进行微调的方案。
技术实现思路
1、本说明书一个或多个实施例提供一种基于隐私保护的大模型微调的方法及装置。
2、根据第一方面,提供一种基于隐私保护的大模型微调的方法,所述方法包括:
3、第一平台采用差分隐私的方式,利用本地持有的、包括第一领域中隐私数据的目标数据集,训练第一小模型,得到适用于所述第一领域的第二小模型,并将所述第二小模型发送给第二平台;
4、所述第二平台以所述第二小模型为老师模型,通过蒸馏学习的方式,对本地持有的大模型进行微调,以得到适用于所述第一领域的大模型。
5、根据第二方面,提供一种基于隐私保护的大模型微调的方法,所述方法由第一平台执行,所述方法包括:
6、获取第一小模型;
7、采用差分隐私的方式,利用本地持有的、包括第一领域中隐私数据的目标数据集,训练第一小模型,得到适用于所述第一领域的第二小模型;
...【技术保护点】
1.一种基于隐私保护的大模型微调的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,所述第一小模型通过以下方式获取:
3.根据权利要求2所述的方法,其中,所述对所述大模型进行压缩处理,得到所述第一小模型,包括:
4.根据权利要求2所述的方法,其中,所述第一小模型的获取还包括:
5.根据权利要求4所述的方法,其中,所述确定所述第一小模型的参数量信息,包括:
6.根据权利要求1所述的方法,其中,所述差分隐私的方式包括以下任意一项:
7.根据权利要求2所述的方法,其中,所述第一小模型中包括多个目标参数;所述训练所述第一小模型包括,将所述第一小模型中的所述目标参数更新为目标数值,以得到所述第二小模型;
8.根据权利要求1所述的方法,其中,所述对大模型进行微调,包括:
9.根据权利要求8所述的方法,其中,所述第一数据基于所述第一领域的提示词而生成。
10.根据权利要求9所述的方法,其中,所述方法还包括:
11.根据权利要求1所述的方法,其中,所述方法还包括,所述第
12.一种基于隐私保护的大模型微调的方法,所述方法由第一平台执行,所述方法包括:
13.根据权利要求12所述的方法,其中,所述获取第一小模型,包括:
14.根据权利要求13所述的方法,其中,所述获取第一小模型,还包括:
15.根据权利要求14所述的方法,其中,所述确定所述第一小模型的参数量信息,包括:
16.根据权利要求12所述的方法,其中,所述差分隐私的方式包括以下任意一项:
17.根据权利要求12所述的方法,其中,所述方法还包括:
18.一种基于隐私保护的大模型微调的方法,所述方法由第二平台执行,所述方法包括:
19.根据权利要求18所述的方法,其中,在接收所述第二小模型之前,所述方法还包括:
20.根据权利要求19所述的方法,其中,所述对所述大模型进行压缩处理,得到所述第一小模型,包括:
21.根据权利要求19所述的方法,其中,在对所述大模型进行压缩处理之前,还包括:
22.根据权利要求19所述的方法,其中,所述第一小模型中包括多个目标参数;所述第二小模型为将所述第一小模型中的所述目标参数更新为目标数值而得到;
23.根据权利要求18所述的方法,其中,所述对大模型进行微调,包括:
24.根据权利要求23所述的方法,其中,所述第一数据基于所述第一领域的提示词而生成;其中,所述方法还包括:
25.根据权利要求18所述的方法,其中,所述方法还包括,从第三平台接收适用于第二领域的第四小模型,以所述第四小模型为老师模型,通过蒸馏学习的方式对所述大模型进行微调,以得到适用于所述第一领域和第二领域的大模型。
26.一种基于隐私保护的大模型微调的装置,所述装置部署于第一平台,所述装置包括:
27.一种基于隐私保护的大模型微调的装置,所述装置部署于第二平台,所述装置包括:
28.一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行权利要求1-25中任一项所述的方法。
29.一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现权利要求1-25中任一项所述的方法。
...【技术特征摘要】
1.一种基于隐私保护的大模型微调的方法,所述方法包括:
2.根据权利要求1所述的方法,其中,所述第一小模型通过以下方式获取:
3.根据权利要求2所述的方法,其中,所述对所述大模型进行压缩处理,得到所述第一小模型,包括:
4.根据权利要求2所述的方法,其中,所述第一小模型的获取还包括:
5.根据权利要求4所述的方法,其中,所述确定所述第一小模型的参数量信息,包括:
6.根据权利要求1所述的方法,其中,所述差分隐私的方式包括以下任意一项:
7.根据权利要求2所述的方法,其中,所述第一小模型中包括多个目标参数;所述训练所述第一小模型包括,将所述第一小模型中的所述目标参数更新为目标数值,以得到所述第二小模型;
8.根据权利要求1所述的方法,其中,所述对大模型进行微调,包括:
9.根据权利要求8所述的方法,其中,所述第一数据基于所述第一领域的提示词而生成。
10.根据权利要求9所述的方法,其中,所述方法还包括:
11.根据权利要求1所述的方法,其中,所述方法还包括,所述第二平台从第三平台接收适用于第二领域的第四小模型,以所述第四小模型为老师模型,通过蒸馏学习的方式对所述大模型进行微调,以得到适用于所述第一领域和第二领域的大模型。
12.一种基于隐私保护的大模型微调的方法,所述方法由第一平台执行,所述方法包括:
13.根据权利要求12所述的方法,其中,所述获取第一小模型,包括:
14.根据权利要求13所述的方法,其中,所述获取第一小模型,还包括:
15.根据权利要求14所述的方法,其中,所述确定所述第一小模型的参数量信息,包括:
16.根据权利要求12所述的方法,其中,所述差分隐...
【专利技术属性】
技术研发人员:刘文炎,殷山,
申请(专利权)人:蚂蚁区块链科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。