一种基于神经元输出的白盒深度学习模型版权保护方法技术

技术编号：32854385 阅读：28 留言：0更新日期：2022-03-30 19:22

本发明专利技术公开了一种基于神经元输出的白盒深度学习模型版权保护方法，包括：设计深度学习模型内部差异度衡量指标，实现高效的种子选取策略以及指纹集生成算法，并在此基础对可疑模型进行差异度测量，最后对可疑模型是否发生侵权行为进行判断。本方法基于模型内部神经元输出，能够自动地为原模型生成指纹集合，并在多种模型窃取场景下有效；且不受数据领域以及模型结构的限制，具备良好的鲁棒性、通用性和可拓展性。相比于传统的模型水印嵌入方法，本方法无需介入深度学习模型的训练过程，避免了繁琐耗时的参数调整过程以及嵌入水印造成的精确度损失，使得对深度学习模型的版权验证及保护变得简单高效。保护变得简单高效。保护变得简单高效。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经元输出的白盒深度学习模型版权保护方法

[0001]本专利技术涉及深度学习模型的安全、隐私领域，特别涉及一种基于神经元输出的白盒深度学习模型版权保护方法。

技术介绍

[0002]深度学习在解决许多实际问题方面取得了巨大成功，例如图像识别、语音识别、自然语言处理等。然而训练深度学习模型并非易事，通常需要大量的资源，包括大型数据集、昂贵的计算资源以及专家知识。此外，训练高性能模型的成本随着任务复杂性和模型容量的增加而迅速增长。例如，在维基百科和图书语料库(15GB)上训练一个BERT模型大概需要160万美元。这让恶意对手(模型窃贼)有动机窃取模型并掩盖他们的踪迹，从而导致模型版权受到侵害和可能的经济损失。事实证明，窃取模型可以非常有效地完成，例如对原模型进行微调或剪枝，甚至在仅暴露原模型API的情况下，攻击者仍然可以利用模型提取技术窃取模型的大部分功能。
[0003]近年来提出的模型水印技术利用深度学习模型过拟合的特性，在训练过程中将秘密水印(例如签名)嵌入模型，来保护深度学习模型的版权。当从可疑模型中提取相同或相似的水印时，可以验证模型所有权。但目前的水印技术有两个关键缺陷：1)水印嵌入需要介入正常的训练过程，导致模型表现受损；2)过拟合嵌入的水印容易被攻击者清除，导致水印失效。因此，需要针对深度学习模型设计新的版权保护方法，用以应对复杂多变的攻击场景。

技术实现思路

[0004]本专利技术的目的在于针对现有深度学习模型水印技术的不足，提出一种基于神经元输出的白盒深度学习模型版权保护方

【技术保护点】

【技术特征摘要】
1.一种基于神经元输出的白盒深度学习模型版权保护方法，其特征在于，包括以下步骤：步骤1：使用置信度优先策略在训练集中选取具有代表性的种子，利用反向传播优化方法基于原模型神经元输出生成特定指纹集合；步骤2：对相同功能的可疑模型进行指纹匹配，将步骤1生成的指纹集合作为输入，获取特定神经元或特定神经层的输出，计算可疑模型和原模型的指标差异度；步骤3：基于指标差异度对是否发生模型窃取进行判断，如果指标差异度小于设定阈值，说明可疑模型和原模型具有相似的神经元输出分布，很有可能是原模型的衍生模型，判定为发生模型窃取，否则判定为没有发生模型窃取。2.根据权利要求1所述的基于神经元输出的白盒深度学习模型版权保护方法，其特征在于，所述步骤1中，基于训练集在原模型上的概率向量输出，计算2
‑
范数作为Gini系数，选取Gini系数最大的一部分样本作为种子。3.根据权利要求1所述的基于神经元输出的白盒深度学习模型版权保护方法，其特征在于，所述步骤1中，对于选定层的每个神经元，基于训练集获取对应神经元的最大输出值，即目标值；对于每个种子样本x
i
，使用反向传播优化算法在该神经元上进行优化，保存在该神经元上输出值大于等于目标值的样本x
′
i
；将种子集合依次进行优化生成最终指纹集合T＝{x
′1，x
′2，
…
}。4.根据权利要求1所述的基于神经元输出的白盒深度学习模型版权保护方法，其特征在于，所述步骤2中，基于深度学习模型的神经元输出特性，设计NOD、NAD、LOD和LAD距离指标；所述NOD距离指标的公式如下：其中φ
l，i
(x)为原模型第l层第i个神经元的输出方程，为可疑模型第l层第i个神经元的输出方程；T＝{x
′1，x
′2，
…
}为基于原模型生成的指纹集合；所述NAD距离指标NAD的公式如下：其中S为阶跃函数，当正则化的神经元输出大于0.5时，返回1，即神经元处于激活状态，否则返回0，即神经元处于未激活状态；所述LOD距离指标LOD的公式如下：其中f
l
和分别为原模型和可疑模型第l层的输出向量，p为范数阶数；所述LAD距离指标LAD的公式如下：
其中...

【专利技术属性】
技术研发人员：王竟亦，陈伽洛，彭汀兰，孙有程，程鹏，马兴军，
申请(专利权)人：浙江大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人