一种多方安全计算方法技术

技术编号：28139572 阅读：20 留言：0更新日期：2021-04-21 19:14

本发明专利技术公开了一种多方安全计算方法，包括如下步骤：1、数据对齐；2、B方对数据进行处理，使处理后的数据不能还原成原数据，包括：归一化、标准化、随机加噪声；3、B方将处理后的信息连同ID发送给A方，A方会将B方发送的数据和自身数据相结合，对B方数据用多层Dense建模，A方对自身数据，根据数据的特定形式，可以用Dense、CNN或者RNN建模，模型的目标是自己的目标。本专利的优点在于：在保证数据安全的情况下，解决了现有纵向联邦学习建模受网络传输的影响，导致建模慢和不能建大型模型的问题，本专利只在需求方的本地训练模型，而不会通过网络大量传输训练调参信息，这样既提高了训练速度，又解决了模型性能的瓶颈问题。又解决了模型性能的瓶颈问题。又解决了模型性能的瓶颈问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种多方安全计算方法

[0001]本专利技术涉及多方安全计算技术和深度学习算法
，具体为一种多方安全计算方法。

技术介绍

[0002]随着大数据技术及AI技术的发展，利用大数据训练人工智能模型的应用越来越多，这些模型能够在企业内部广泛使用。随着AI领域深度学习的发展，模型能够使用的数据越多，模型效果能提升的越好，因此业界提出了联合多方数据共同训练模型，但这时碰到了数据安全问题，各方并不希望自己的数据被对方掌握，尤其有一些数据是个人隐私数据，法律上是不能直接使用的。业界出现了一种联邦学习算法，目标是在保证不透露原始数据的基础上，多方联合建模。
[0003]联邦学习包括横向联邦学习和纵向联邦学习，本专利针对的应用场景同纵向联邦学习一致，简单来说，A方有一批数据和学习目标，B方有另一批数据，这两批数据有一部分数据能够匹配，例如是相同的用户，要求在A不知道B的数据，B也不知道A数据和学习目标的情况下，训练一个AI模型，能够达到A的学习目标。现有的技术无法实现上述功能。

技术实现思路

[0004]为解决上述问题，本专利提供了一种多方安全计算方法。
[0005]一种多方安全计算方法，包括如下步骤：
[0006]1、数据对齐：A方和B方都有自己的数据，但是训练模型的时候每条数据必须是同一个样本的，例如不能把一个人的性别和另一个人的年龄合成一个样本。所以要把A和B的数据做对齐，用MD5的方法，A和B方约定某种很难穷举的数据作为样本ID，例如身份证号+姓名+手机号，A将自己的样本ID转换成...

【技术保护点】

【技术特征摘要】
1.一种多方安全计算方法，包括如下步骤：1)、数据对齐：A方和B方都有自己的数据，但是训练模型的时候每条数据必须是同一个样本的，把A和B的数据做对齐，用MD5的方法，A和B方约定很难穷举的数据作为样本ID，A将自己的样本ID转换成MD5，发送给B方，B方也将自己数据的ID转化成MD5，然后看那些能够和A方的MD5样本ID对应上，对应上的这批就是双方共有的样本，B方将共有ID的结果发送给A方，这样就对齐了双方的样本；2)、B方对数据进行处理，使处理后的数据不能还原成原数据，包括：归一化、标准化、随机加噪声；为数据引入随机性，随机数的范围限制在现有数据范围中；3)、B方将处理后的信息连同ID发送给A方，A方会将B方发送的数据和自身数据相结合，对B方数据用多层Dense建模，A方对自身数据，根据数据的特定形式，可以用Dense、CNN或者RNN建模，模型的目标是自己的目标。2.根据权利...

【专利技术属性】
技术研发人员：孙俊，
申请(专利权)人：大有秦鼎北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人