一种模型训练中的权重聚合方法、装置及系统制造方法及图纸

技术编号：35997454 阅读：14 留言：0更新日期：2022-12-17 23:14

本申请公开了一种模型训练中的权重聚合方法、装置及系统，涉及多方安全计算技术领域和隐私计算技术领域，包括：分片聚合设备接收模型训练设备发送的梯度分片，该梯度分片为该模型训练设备将模型训练得到的梯度进行拆分得到的多个梯度分片之一，该多个梯度分片的数量与多个分片聚合设备的数量相同，该多个梯度分片中的其他梯度分片分别由该模型训练设备一一对应的发送给其他分片聚合设备；当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片；向模型训练设备发送权重分片。采用本方案，实现了采用多方安全技术对机器学习模型的联合训练。对机器学习模型的联合训练。对机器学习模型的联合训练。

全部详细技术资料下载

【技术实现步骤摘要】
一种模型训练中的权重聚合方法、装置及系统

[0001]本申请涉及多方安全计算
和隐私计算
，尤其涉及一种模型训练中的权重聚合方法、装置及系统。

技术介绍

[0002]在机器学习
，可以使用历史数据进行机器学习模型的训练，其训练过程往往是一个迭代的过程，通过迭代不断优化机器学习模型的参数。例如，在逻辑回归模型中，模型的参数可以称作权重，每个迭代过程的训练中，使用训练数据和当前权重进行计算，并基于计算结果和模型的标签计算出用于调整权重的梯度，并使用梯度调整当前权重得到新的权重，用于下一次迭代过程的训练。
[0003]在机器学习技术的实际应用中，为了提高训练效率，提出了异步机器学习的训练方式，利用分布式数据和计算资源实现机器学习模型的联合训练。
[0004]如图1所示，全部的训练数据分布在多个模型训练设备，每个模型训练设备持有一部分训练数据，在完成一次训练后，向中心化权重聚合节点发送本次训练得到的梯度，例如，模型训练设备1向中心化权重聚合节点发送梯度g1，中心化权重聚合节点将接收的梯度与当前权重进行聚合，得到最新的权重w，并在模型训练设备请求权重时，将最新的权重返回给模型训练设备，供模型训练设备使用最新的权重进行训练。
[0005]在异步机器学习的训练方式，不需要各模型训练设备同步上传各自训练得到的梯度，各模型训练设备又可以同步执行训练过程，因此，提高了训练效率，并且能够更有效的利用计算资源。
[0006]多方安全计算（MPC）可以在保护个人隐私信息的前提下，实现隐私数据共...

【技术保护点】

【技术特征摘要】
1.一种模型训练中的权重聚合方法，其特征在于，应用于模型训练系统中的每个分片聚合设备，所述模型训练系统包括多个分片聚合设备和多个模型训练设备，所述方法，包括：接收模型训练设备发送的梯度分片，该梯度分片为该模型训练设备将模型训练得到的梯度进行拆分得到的多个梯度分片之一，该多个梯度分片的数量与所述多个分片聚合设备的数量相同，该多个梯度分片中的其他梯度分片分别由该模型训练设备一一对应的发送给其他分片聚合设备，其他每个分片聚合设备接收到其中一个梯度分片；当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片；向模型训练设备发送所述权重分片。2.如权利要求1所述的方法，其特征在于，所述当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片，包括：当需要进行梯度聚合时，针对本次聚合所接收到的来自各模型训练设备的各梯度分片，确定其中是否存在不参与聚合的梯度分片，当一个梯度分片的其他属于同一梯度的梯度分片未全部被其他分片聚合设备接收到时，该梯度分片为不参与聚合的梯度分片；将本次聚合所接收到的来自各模型训练设备的各梯度分片中需要参与聚合的梯度分片进行聚合，得到本次聚合的权重分片。3.如权利要求1所述的方法，其特征在于，所述当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，包括：当聚合周期到达时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合。4.如权利要求1所述的方法，其特征在于，所述当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，包括：当接收到模型训练设备发送的权重请求时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合；所述向模型训练设备发送所述权重分片，包括：向发送所述权重请求的该模型训练设备发送所述权重分片。5.一种模型训练中的权重聚合方法，其特征在于，应用于模型训练系统中的每个模型训练设备，所述模型训练系统包括多个分片聚合设备和多个模型训练设备，所述方法，包括：将本次模型训练得到的梯度拆分为多个梯度分片，该多个梯度分片的数量与所述多个分片聚合设备的数量相同；向所述多个分片聚合设备一一对应的发送所述多个梯度分片，每个分片聚合设备接收到其中一个梯度分片，使得分片聚合设备在接收到梯度分片后，当需要进行梯度聚合时，基于本次聚合所接收到的来自各模型训练设备的各梯度分片，进行梯度聚合，得到本次聚合的权重分片。6.如权利要求5所述的方法，其特征...

【专利技术属性】
技术研发人员：陈智隆，陈琨，苏乐，
申请(专利权)人：华控清交信息科技北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人