一种面向机器学习模型的成员推理隐私攻击方法及系统技术方案

技术编号：32131911 阅读：23 留言：0更新日期：2022-01-29 19:32

本发明专利技术涉及一种面向机器学习模型的成员推理隐私攻击方法及系统。该方法包括：获取目标模型以及目标数据；根据所述目标数据，采用对抗样本生成算法，生成对抗样本；所述对抗样本生成算法包括：自适应贪婪算法与二分搜索算法结合方法或借助主成分技术在流形界面上的嵌入映射算法；确定所述目标数据与相应的对抗样本的欧式距离；根据所述欧式距离确定判定结果，实现成员推理；所述判定结果包括：目标数据属于训练数据集或目标数据属于测试数据集。本发明专利技术能够解决黑盒成员推理攻击存在访问成本高、可迁移性弱、稳健性差的问题。稳健性差的问题。稳健性差的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向机器学习模型的成员推理隐私攻击方法及系统

[0001]本专利技术涉及机器学习领域，特别是涉及一种面向机器学习模型的成员推理隐私攻击方法及系统。

技术介绍

[0002]物联网、大数据、云计算等新兴技术使得海量数据的采集、存储和处理成为可能，人工智能特别是机器学习理论与技术的快速发展，在安防、交通、医疗等各领域得到了广泛应用。与此同时，机器学习的安全与隐私问题成为人们关注的焦点，有学者提出了对抗样本攻击、数据投毒攻击、模型推断以及成员推理等各类安全与隐私攻击模型。这些有效的攻击方法引发了人们对机器学习的担忧，同时也成为机器学习发展的内生动力之一，推动科学研究人员和工程技术人员研发安全与隐私性更好的机器学习算法和模型。研究机器学习隐私攻击模型能够推动人们更加深入的理解机器学习模型的深层机理，揭示隐私泄露的本质原因，有利于更好地防范机器学习模型的隐私泄露风险，并有利于推动设计更加高效保护隐私的机器学习模型。
[0003]机器学习成员推理攻击是敌手通过分析机器学习模型来推断目标数据样本是否包含于该机器学习模型训练样本数据集的一种隐私攻击方法，该攻击主要作用于训练样本数据集，威胁机器学习训练样本的成员关系隐私。现有工作大致可分为黑盒成员推理攻击和白盒成员推理攻击2类。
[0004]在黑盒成员推理中，一类方法是基于模型预测置信度来进行成员推理；另一类方法是基于标签决策进行成员推理。这两类攻击方法仅能通过查询目标模型获得输入输出对，而不能获得任何关于模型的额外数据，即借助目标模型的输出结果来完成成员推断。其中...

【技术保护点】

【技术特征摘要】
1.一种面向机器学习模型的成员推理隐私攻击方法，其特征在于，包括：获取目标模型以及目标数据；根据所述目标数据，采用对抗样本生成算法，生成对抗样本；所述对抗样本生成算法包括：自适应贪婪算法与二分搜索算法结合方法或借助主成分技术在流形界面上的嵌入映射算法；确定所述目标数据与相应的对抗样本的欧式距离；根据所述欧式距离确定判定结果，实现成员推理；所述判定结果包括：目标数据属于训练数据集或目标数据属于测试数据集。2.根据权利要求1所述的一种面向机器学习模型的成员推理隐私攻击方法，其特征在于，所述根据所述目标数据，采用对抗样本生成算法，生成对抗样本，具体包括：向目标数据添加高斯扰动生成对抗样本的初始值；根据所述对抗样本的初始值，采用自适应贪婪算法与二分搜索算法结合方法，获得局部最优方向；沿着所述局部最优方向，进行迭代更新，获取最贴近决策边界的对抗样本点，生成对抗样本。3.根据权利要求1所述的一种面向机器学习模型的成员推理隐私攻击方法，其特征在于，所述所述根据所述目标数据，采用对抗样本生成算法，生成对抗样本，具体包括：根据训练数据集和目标数据确定合成数据集；对所述合成数据集进行主成分降维处理，获得流形界面；对所述流形界面进行投影方向的搜寻，获得流形界面的投影点，生成对抗样本。4.根据权利要求1所述的一种面向机器学习模型的成员推理隐私攻击方法，其特征在于，所述根据所述欧式距离确定判定结果，实现成员推理，具体包括：获取判定阈值；判断所述欧式距离是否大于判定阈值；若大于，则目标数据属于训练数据集；反之，则目标数据属于测试数据集。5.一种面向机器学习模型的成员推理隐私攻击系统，其特征在于，包括：数据获取模块，用于获取目标模型以及目...

【专利技术属性】
技术研发人员：彭长根，高婷，刘惠篮，丁红发，蒋合领，
申请(专利权)人：贵州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人