可解释性深度学习的差分隐私保护方法技术

技术编号：24411722 阅读：21 留言：0更新日期：2020-06-06 09:31

本发明专利技术公开一种可解释性深度学习的差分隐私保护方法，通过在FF‑CNN的第一层卷积层加入差分隐私保护以及在模型的输出层的损失函数中加入差分隐私，保证了模型的输入与输出端的安全，从而保护了模型数据提供者的个人隐私，并且通过在第二次采样层得到的数据特征利用k‑means++算法进行聚类后，进行mixup插值法进行数据增强，提升整个模型的鲁棒性。本发明专利技术基于可解释性深度学习模型的隐私保护策略，使得模型使用者可以利用深度学习模型得到具有可解释性的结果并且不泄露个人的隐私信息。

Differential privacy protection based on interpretable deep learning

全部详细技术资料下载

【技术实现步骤摘要】
可解释性深度学习的差分隐私保护方法
本专利技术涉及深度学习与隐私保护
，具体涉及一种可解释性深度学习的差分隐私保护方法。
技术介绍
近年来，深度学习是机器学习研究的一个新领域。它就像人类大脑一样，有能力学习和处理复杂的数据，并尝试解决负责的任务。由于这种能力，它被用于各种领域内，例如文本提取，声音识别，图像分类与识别等。卷积神经网络(CNN)作为深度学习的一种具有代表性的网络结构，广泛被应用于各类图像识别，语义分割的场景，卷积神经网络从宏观的概念上来讲，可以分为特征提取和特征识别两大部分，通过卷积(convolution)操作与采样(pooling)操作对原始图像进行有效的特征提取，然后通过全连接层(fullconnection)的变换对提取出来的有效特征进行精准识别。然而，卷积神经网络的训练需要大量的数据，这些数据中包含着用户个人的敏感信息，如果卷积神经网络模型不加以保护直接发布出来的话，将会对数据提供者的隐私造成一定的泄露，那么数据提供者的利益也将受到损害，导致不愿再提供数据的结果，从而影响模型的训练。对于深度学习的模型来说，就是一个黑盒子，数据拥有者看不到模型是通过什么动作或者原因得出这样一个判断结果，这样对于深度神经网络模型做出的决策，使用者常常会持有怀疑的态度。即使，模型的预测精度已经达到很高的程度。所以，可解释性的深度神经网络对于深度学习的发展具有很大的促进作用，然而可解释性的深度神经网络仍然存在隐私泄露的问题，需要采取一定的隐私保护手段来保证数据提供者的隐私。目前，在机器学习隐私保...

【技术保护点】
1.可解释性深度学习的差分隐私保护方法，其特征是，包括步骤如下：/n步骤1、初始化可解释性深度学习模型，该可解释性深度学习模型基于前向传播的可解释性卷积神经网络，并依次包括输入层、第一卷积层、第一采样层、第二卷积层、第二采样层、第一全连接层、第二全连接层和输出层；/n步骤2、将给定的数据集进行归一化处理后，作为可解释性深度学习模型的训练数据集；/n步骤3、利用步骤2的训练数据集对步骤1所得的可解释性深度学习模型的第一卷积层进行训练，以更新可解释性深度学习模型；即：/n步骤3.1、对训练数据集进行主成分分析，得到各个主成分的特征值和特征向量；/n步骤3.2、对各个主成分的特征值进行降序排序，并选出特征值排在前6位的主成分所对应的特征向量；/n步骤3.3、基于所分配的第一隐私预算ε

【技术特征摘要】
1.可解释性深度学习的差分隐私保护方法，其特征是，包括步骤如下：
步骤1、初始化可解释性深度学习模型，该可解释性深度学习模型基于前向传播的可解释性卷积神经网络，并依次包括输入层、第一卷积层、第一采样层、第二卷积层、第二采样层、第一全连接层、第二全连接层和输出层；
步骤2、将给定的数据集进行归一化处理后，作为可解释性深度学习模型的训练数据集；
步骤3、利用步骤2的训练数据集对步骤1所得的可解释性深度学习模型的第一卷积层进行训练，以更新可解释性深度学习模型；即：
步骤3.1、对训练数据集进行主成分分析，得到各个主成分的特征值和特征向量；
步骤3.2、对各个主成分的特征值进行降序排序，并选出特征值排在前6位的主成分所对应的特征向量；
步骤3.3、基于所分配的第一隐私预算ε1对步骤3.2所选出的特征向量即初始特征向量进行拉普拉斯加噪，得到满足差分隐私的特征向量；
步骤3.4、对步骤3.3所得的满足差分隐私的特征向量进行截断操作，得到最终特征向量，并将最终特征向量作为可解释性深度学习模型的第一卷积层的6个卷积核，以更新可解释性深度学习模型；
步骤4、将步骤2的训练数据集从步骤3所得的可解释性深度学习模型的第一卷积层的输入输入，第二采样层的输出输出，得到第一特征数据集；
步骤5、先采用k-menas++算法对步骤4所得的第一特征数据集中的样本数据进行聚类，得到第一带标签的特征数据集；再利用Mixup算法对第一带标签的特征数据集进行增强操作，得到第一增强数据集；
步骤6、对第一增强数据集进行最小二乘回归计算，并将计算所得的映射系数向量作为可解释性深度学习模型的第二采样层与第一全连接层的连接参数，以更新可解释性深度学习模型；
步骤7、将步骤5所得的第一增强数据集从步骤6所得的可解释性深度学习模型的第一全连接层的输入输入，第一全连接层的输出输出，得到第二特征数据集；
步骤8、先采用k-menas++算法对步骤7所得的第二特征数据集中的样本数据进行聚类，得到第二带标签的特征数据集；再利用Mixup算法对第二带标签的特征数据集进行增强操作，得到第二增强数据集；
步骤9、对第二增强数据集进行最小二乘回归计算，并将计算所得的映射系数向量作为可解释性深度学习模型的第一全连接层与第二全连接层的连接参数，以更新可解释性深度学习模型；
步骤10、基于所分配的第二隐私预算ε2对步骤9所得的可解释性深度学习模型的输出层的平方误差损失函数的展开式的系数进行...

【专利技术属性】
技术研发人员：王金艳，李德，胡宇航，李先贤，
申请(专利权)人：广西师范大学，
类型：发明
国别省市：广西;45

全部详细技术资料下载我是这个专利的主人