一种模型的所有权验证方法、装置、存储介质及电子设备制造方法及图纸

技术编号:36338576 阅读:51 留言:0更新日期:2023-01-14 17:51
本说明书公开了一种模型的所有权验证方法、装置、存储介质及电子设备,所述方法包括:向原始样本中添加指定特征且不调整原始样本的标注,使调整后样本的标注与调整后样本对应的原始样本的标注相同,根据调整后样本输入待验证模型得到的梯度和输入以原始样本训练的良性模型得到的梯度,判断训练所述待验证模型的样本是否来源于边缘节点。本方法中因调整后样本和其对应的原始样本的标注相同,所以在无法通过标注判断待验证模型的所有权的情况下,通过调整后样本在待验证模型和良性模型中的梯度表现不同来判断训练待验证模型的样本是否来源于边缘节点,可以更加准确地判断待验证模型的所有权。模型的所有权。模型的所有权。

【技术实现步骤摘要】
一种模型的所有权验证方法、装置、存储介质及电子设备


[0001]本申请涉及计算机
,尤其涉及一种模型的所有权验证方法、装置、存储介质及电子设备。

技术介绍

[0002]随着人工智能的发展,机器学习模型得到了广泛应用。横向联邦学习是分布式训练的一种,其主要目的是保护作为训练样本的隐私数据不泄露。具体的,各个边缘节点接收参数服务器发送的模型参数,以该模型参数生成机器学习模型,并将该边缘节点本地保存的隐私数据作为训练样本输入该机器学习模型,根据机器学习模型输出的结果和训练样本对应的标注得到梯度,再将得到的梯度上传给参数服务器,以使参数服务器更新模型参数,以此迭代。
[0003]然而,使用上述方式训练模型虽然可以保护边缘节点的隐私数据,但可能会出现模型的所有权问题。例如,边缘节点只允许参数服务器利用边缘节点上传的梯度训练一个特定的模型,并限制模型只能用于特定的用途,但参数服务器可能会在未经边缘节点允许的情况下使用边缘节点上传的梯度训练其他模型,或者,参数服务器也可能会将训练好的模型用于其他用途。
[0004]因此,对于一个待验证模型,如何判断该待验证模型是否是通过边缘节点自身保存的隐私数据训练得到的称为一个亟待解决的问题。

技术实现思路

[0005]本说明书提供一种模型的所有权验证方法、装置、存储介质及电子设备,以部分的解决现有技术存在的上述问题。
[0006]本说明书采用下述技术方案:
[0007]本说明书提供一种模型的所有权验证方法,包括:
[0008]获取边缘节点本地保存的调整后样本以及所述调整后样本的标注;其中,所述调整后样本是将指定特征添加到原始样本中得到的,所述调整后样本的标注与所述调整后样本对应的原始样本的标注相同;
[0009]将所述调整后样本输入待验证模型,根据所述待验证模型的输出结果以及所述调整后样本对应的标注,确定所述待验证模型的梯度,作为第一梯度;将所述调整后样本输入预先保存的良性模型,根据所述良性模型的输出结果以及所述调整后样本对应的标注,确定所述良性模型的梯度,作为第二梯度;其中,所述良性模型是根据所述原始样本训练得到的;
[0010]根据所述第一梯度和所述第二梯度,判断训练所述待验证模型的样本是否来源于所述边缘节点。
[0011]可选地,不同的调整后样本对应的原始样本不同,且不同的调整后样本中包含的指定特征相同。
[0012]可选地,根据所述第一梯度和所述第二梯度,判断训练所述待验证模型的样本是否来源于所述边缘节点,具体包括:
[0013]将所述第一梯度和所述第二梯度输入预先训练的分类器,通过所述分类器判断训练所述待验证模型的样本是否来源于所述边缘节点。
[0014]可选地,预先训练分类器,具体包括:
[0015]将所述调整后样本输入预先保存的受害者模型,根据所述受害者模型的输出结果以及所述调整后样本对应的标注,确定所述受害者模型的梯度,作为第三梯度;其中,所述受害者模型是根据包含所述原始样本和所述调整后样本的样本集训练得到的;
[0016]以所述第二梯度和所述第三梯度为训练样本,以所述第二梯度和所述第三梯度的来源模型为标注,对所述分类器进行训练,其中,所述第二梯度的来源模型为良性模型,所述第三梯度的来源模型为受害者模型。
[0017]可选地,通过所述分类器判断训练所述待验证模型的样本是否来源于所述边缘节点,具体包括:
[0018]当所述分类器输出的结果为第一梯度的来源模型是所述受害者模型时,确定所述待验证模型的样本来源于所述边缘节点;
[0019]当所述分类器输出的结果为第一梯度的来源模型是所述良性模型时,确定所述待验证模型的样本不来源于所述边缘节点。
[0020]可选地,预先训练受害者模型,具体包括:
[0021]确定由原始样本构成的第一样本集以及由调整后样本构成的第二样本集,并接收参数服务器发送的待训练模型;
[0022]根据所述第一样本集中的样本以及所述第一样本集中的样本对应的标注,确定所述待训练模型的梯度;
[0023]将所述待训练模型的梯度发送给所述参数服务器,使所述参数服务器根据所述待训练模型的梯度更新所述待训练模型;
[0024]接收所述参数服务器发送的更新后的待训练模型,作为中间模型;
[0025]根据所述第二样本集中的样本以及所述第二样本集中的样本对应的标注,确定所述中间模型的梯度;
[0026]将所述中间模型的梯度发送给所述参数服务器,使所述参数服务器根据所述中间模型的梯度更新所述中间模型,得到受害者模型;
[0027]接收并存储所述参数服务器发送的受害者模型。
[0028]可选地,在接收所述参数服务器发送的更新后的待训练模型,作为中间模型之后,所述方法还包括:
[0029]将所述中间模型作为良性模型保存。
[0030]本说明书提供了一种模型的所有权验证装置,包括:
[0031]获取模块,用于获取边缘节点本地保存的调整后样本以及所述调整后样本的标注;其中,所述调整后样本是将指定特征添加到原始样本中得到的,所述调整后样本的标注与所述调整后样本对应的原始样本的标注相同;
[0032]确定梯度模块,用于将所述调整后样本输入待验证模型,根据所述待验证模型的输出结果以及所述调整后样本对应的标注,确定所述待验证模型的梯度,作为第一梯度;将
所述调整后样本输入预先保存的良性模型,根据所述良性模型的输出结果以及所述调整后样本对应的标注,确定所述良性模型的梯度,作为第二梯度;其中,所述良性模型是根据所述原始样本训练得到的;
[0033]验证模块,用于根据第一梯度和第二梯度,判断训练所述待验证模型的样本是否来源于所述边缘节点。
[0034]可选地,不同的调整后样本对应的原始样本不同,且不同的调整后样本中包含的指定特征相同。
[0035]可选地,所述验证模块具体用于,将所述第一梯度和所述第二梯度输入预先训练的分类器,通过所述分类器判断训练所述待验证模型的样本是否来源于所述边缘节点。
[0036]可选地,所述装置还包括:
[0037]第一训练模块,用于将所述调整后样本输入预先保存的受害者模型,根据所述受害者模型的输出结果以及所述调整后样本对应的标注,确定所述受害者模型的梯度,作为第三梯度;其中,所述受害者模型是根据包含所述原始样本和所述调整后样本的样本集训练得到的;以所述第二梯度和所述第三梯度为训练样本,以所述第二梯度和所述第三梯度的来源模型为标注,对所述分类器进行训练,其中,所述第二梯度的来源模型为良性模型,所述第三梯度的来源模型为受害者模型。
[0038]可选地,所述验证模块具体用于,当所述分类器输出的结果为第一梯度的来源模型是所述受害者模型时,确定所述待验证模型的样本来源于所述边缘节点;当所述分类器输出的结果为第一梯度的来源模型是所述良性模型时,确定所述待验证模型的样本不来源于所述边缘节点。
[0039]可选地本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型的所有权验证方法,包括:获取边缘节点本地保存的调整后样本以及所述调整后样本的标注;其中,所述调整后样本是将指定特征添加到原始样本中得到的,所述调整后样本的标注与所述调整后样本对应的原始样本的标注相同;将所述调整后样本输入待验证模型,根据所述待验证模型的输出结果以及所述调整后样本对应的标注,确定所述待验证模型的梯度,作为第一梯度;将所述调整后样本输入预先保存的良性模型,根据所述良性模型的输出结果以及所述调整后样本对应的标注,确定所述良性模型的梯度,作为第二梯度;其中,所述良性模型是根据所述原始样本训练得到的;根据所述第一梯度和所述第二梯度,判断训练所述待验证模型的样本是否来源于所述边缘节点。2.如权利要求1所述的方法,不同的调整后样本对应的原始样本不同,且不同的调整后样本中包含的指定特征相同。3.如权利要求1所述的方法,根据所述第一梯度和所述第二梯度,判断训练所述待验证模型的样本是否来源于所述边缘节点,具体包括:将所述第一梯度和所述第二梯度输入预先训练的分类器,通过所述分类器判断训练所述待验证模型的样本是否来源于所述边缘节点。4.如权利要求3所述的方法,预先训练分类器,具体包括:将所述调整后样本输入预先保存的受害者模型,根据所述受害者模型的输出结果以及所述调整后样本对应的标注,确定所述受害者模型的梯度,作为第三梯度;其中,所述受害者模型是根据包含所述原始样本和所述调整后样本的样本集训练得到的;以所述第二梯度和所述第三梯度为训练样本,以所述第二梯度和所述第三梯度的来源模型为标注,对所述分类器进行训练,其中,所述第二梯度的来源模型为良性模型,所述第三梯度的来源模型为受害者模型。5.如权利要求4所述的方法,通过所述分类器判断训练所述待验证模型的样本是否来源于所述边缘节点,具体包括:当所述分类器输出的结果为第一梯度的来源模型是所述受害者模型时,确定所述待验证模型的样本来源于所述边缘节点;当所述分类器输出的结果为第一梯度的来源模型是所述良性模型时,确定所述待验证模型的样本不来源于所述边缘节点。6.如权利要求4所述的方法,预先训练受害者模型,具体包括:确定由原始样本构成的第一样本集以及由调整后样本构成的第二样本集,并接收参数服务器发送的待训练模型;根据所述第一样本集中的样本以及所述第一样本集中的样本对应的标注,确定所述待训练模型的梯度;将所述待训练模型的梯度发送给所述参数服务器,使所述参数服务器根据所述待训练模型的梯度更新所述待训练模型;接收所述参数服务器发送的更新后的待训练模型,作为中间模型;根据所述第二样本集中的样本以及所述第二样本集中的样本对应的标注,确定所述中间模型的梯度;
将所述中间模型的梯度发送给所述参数服务器,使所述参数服务器根据所述中间模型的梯度更新所述中间模型,得到受害者模型;接收并存储所述参数服务器发送的受害者模型。7.如权利要求6所述的方法,在接收所述参数服务器发送的更新后的待训练模型,作为中间模型之后,还包括:将所述中间模型作为良性模型保存。8.一种模型的所有权验证装置,包括:获取模块,用于获取边缘节点本地保存的调整后样本以及所述调整后样本的标注;其中,所述调整后样本是...

【专利技术属性】
技术研发人员:李一鸣刘焱朱玲慧翁海琴江勇夏树涛
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1