一种提高隐私推理效率的方法技术

技术编号:38567023 阅读:13 留言:0更新日期:2023-08-22 21:04
一种提高隐私推理效率的方法包括:获取数据集;将数据集中的样本数据进行预处理,得到预处理后样本数据;将预处理后样本数据输入至机器学习模型中进行训练,得到训练好的机器学习模型参数;客户端和服务端共同运行密码协议:客户端将待推理数据经预处理后输入至密码协议中,服务端将训练好的机器学习模型参数输入至密码协议中;客户端得到推理结果作为输出,服务端得到空输出,客户端无法得到服务端机器学习模型参数,服务端也无法得到客户端的隐私输入,从而保障了客户隐私数据的安全性。本发明专利技术提供了一种提高隐私推理效率的方法以达到提高基于密码协议隐私保护机器学习推理系统计算效率和通信效率的目的。系统计算效率和通信效率的目的。系统计算效率和通信效率的目的。

【技术实现步骤摘要】
一种提高隐私推理效率的方法


[0001]本专利技术涉及信息安全
,具体涉及一种提高隐私推理效率的方法。

技术介绍

[0002]数据蕴含着巨大的价值,但同时也存在着泄露隐私带来的风险与损失。随着数据的积累、各种新算法的出现以及算力的提升,机器学习迎来了一次大发展。而将个人数据,如人脸、指纹等隐私数据发送给机器学习推理服务提供方会带来隐私泄露的风险。因此,出现了一些利用同态加密、秘密共享、不经意传输、混淆电路等密码学技术来保护用户隐私的机器学习推理系统(可证明安全协议),如实用两方安全推理(CrypTFLOW2)、猎豹(Cheetah)等,它们具有可证明的安全性。但是保护隐私的机器学习推理系统需要非常大的计算量和通信量,例如在局域网的条件下,Cheetah跑一次残差网络(ResNet50),需要32.6秒和2.3GB的通信量,计算量和通信量过大导致推理效率低。因此效率问题成为了利用密码学技术保护隐私技术的痛点,所以亟需一种提高隐私推理效率的方法。

技术实现思路

[0003]针对上述问题,本专利技术提供了一种提高隐私推理效率的方法以达到提高基于密码协议隐私保护机器学习推理系统计算效率和通信效率的目的。
[0004]一种提高隐私推理效率的方法,该方法包括以下步骤:
[0005]步骤1:获取数据集;
[0006]步骤2:将数据集中的样本数据进行预处理,得到预处理后样本数据,数据经过压缩后,降低了推理任务的计算量和通信量,从而提高隐私推理的效率;
[0007]步骤3:将所述预处理后样本数据输入至机器学习模型中进行训练,得到训练好的所述机器学习模型参数;
[0008]步骤4:客户端和服务端共同运行密码协议:客户端将待推理数据经预处理后输入至密码协议中,服务端将训练好的所述机器学习模型参数输入至密码协议中;客户端得到推理结果作为输出,服务端得到空输出,客户端无法得到服务端机器学习模型参数,服务端也无法得到客户端的隐私输入,从而保障了客户隐私数据的安全性。
[0009]优选的,所述密码协议为利用密码学设计的可证明安全协议。
[0010]优选的,所述密码学包括同态加密、不经意传输、秘密共享、混淆电路。
[0011]优选的,所述可证明安全协议为猎豹。
[0012]优选的,数据预处理的方法为数据降维。
[0013]优选的,所述数据降维的算法为主成分分析、核主成分分析、自动编码器中的一种。
[0014]优选的,通过开源数据库获取数据集,本领域技术人员可根据实际应用场景和需要自定义数据集的类型,但均适用于本专利技术提供的方法。
[0015]优选的,所述机器学习模型为ResNet50。
[0016]本专利技术提供的一种提高隐私推理效率的方法,将数据进行降维后,进行隐私推理,降低了隐私推理过程中的计算量和通信量,提高了隐私推理的效率;同时本专利技术采用实用安全两方计算,客户端无法获取服务端的机器学习模型参数,服务端无法获取客户端的隐私输入,防止隐私泄露,确保了客户隐私数据的安全性。
附图说明:
[0017]附图1是本专利技术实施例中一种提高隐私推理效率的方法的流程图。
具体实施方式:
[0018]为了使本专利技术技术方案更容易理解,现用具体实施例的方式,对本专利技术设计的一种提高隐私推理效率的方法进行清晰、完整的描述。
[0019]以下结合说明书附图1对本专利技术提供的一种提高隐私推理效率的方法进行说明,所述方法具体包括以下步骤:
[0020]步骤100:在开源数据中获取数据集,本实施例中的数据集为图像数据集。
[0021]步骤110:将数据集中的样本数据进行预处理,得到预处理后样本数据;预处理的方法为数据降维,数据降维的算法为主成分分析(PCA)、核主成分分析(KPCA)、自动编码器(AE)中的一种。数据经过压缩后,降低了推理任务的计算量和通信量,从而提高隐私推理的效率。
[0022]步骤120:将所述预处理后样本数据输入至机器学习模型中进行训练,得到训练好的所述机器学习模型参数;若选定的数据降维算法为PCA或KPCA,那么直接将整个数据输入数据降维算法中,得到压缩后的数据集,再利用压缩后的数据集训练机器学习模型ResNet50,得到模型的参数;若选定的压缩算法为AE,那么先用数据集训练AE,得到AE的模型参数,再利用训练好的AE将数据集压缩成压缩后的数据集,接着利用压缩后的数据集训练ResNet50,得到ResNet50的模型参数。
[0023]步骤130:客户端和服务端共同运行密码协议:客户端将待推理数据经预处理后输入至密码协议中,服务端将训练好的所述机器学习模型参数输入至密码协议中;客户端得到推理结果作为输出,服务端得到空输出,客户端无法得到服务端机器学习模型参数,服务端也无法得到客户端的隐私输入,从而保障了客户隐私数据的安全性,所述密码协议为利用同态加密、不经意传输、秘密共享、混淆电路等密码学设计的可证明安全协议,所述可证明安全协议为猎豹。
[0024]应当指出:对于本
的普通技术人员来说,在不脱离本专利技术原理和宗旨的的前提下,还可以做出若干改进、替换、变型和润饰,这些改进、替换、变型和润饰也应视为本专利技术的保护范围。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提高隐私推理效率的方法,其特征在于,所述方法包括:步骤1:获取数据集;步骤2:将数据集中的样本数据进行预处理,得到预处理后样本数据;步骤3:将所述预处理后样本数据输入至机器学习模型中进行训练,得到训练好的所述机器学习模型参数;步骤4:客户端和服务端共同运行密码协议:客户端将待推理数据经预处理后输入至密码协议中,服务端将训练好的所述机器学习模型参数输入至密码协议中;客户端得到推理结果作为输出,服务端得到空输出。2.如权利要求1所述的一种提高隐私推理效率的方法,其特征在于,所述密码协议为利用密码学设计的可证明安全协议。3.如权利要求2所述的一种提高隐私推理效率的方法...

【专利技术属性】
技术研发人员:王靖午罗晨晨蔡帅
申请(专利权)人:方盈金泰科技北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1