保护数据隐私的图片分类方法及装置制造方法及图纸

技术编号:24169768 阅读:15 留言:0更新日期:2020-05-16 02:34
本说明书实施例提供一种保护数据隐私的图片分类方法。该方法的执行主体为数据持有方,其中存储多个隐私图片和对应的多个类别标签,该方法包括:首先,针对该多个隐私图片中任意的第一隐私图片,确定与该第一隐私图片对应的多个特征值,组成第一原始特征矩阵;接着,对该第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;然后,将得到的对应于该多个隐私图片的多个变换特征矩阵,以及该多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类。如此,可以同时实现保护隐私图片的数据隐私和防御针对图片分类模型的对抗攻击。

【技术实现步骤摘要】
保护数据隐私的图片分类方法及装置
本说明书一个或多个实施例涉及数据计算安全的
,尤其涉及一种保护数据隐私的图片分类方法及装置、以及一种保护数据隐私的样本预测方法及装置。
技术介绍
随着机器学习技术的兴起,该领域中出现的保护数据隐私的问题和防御对抗攻击以保护模型安全的问题,已成为研究热点。具体地,在互联网大数据时代,利用大数据建立机器学习模型,已成为各行各业的需求常态,而建模过程中存在隐私数据,如用户敏感数据,泄露的风险,因此,如何保护数据的隐私安全成为亟待解决的问题。另外,现代机器学习模型,如深度神经网络模型,是非常容易受到对抗样本攻击的,这些对抗样本仅包含很轻微的扰动,但会导致机器学习模型以高置信度输出错误的预测结果。例如,在图像识别场景下,原来被图像处理模型识别为熊猫的图片,在加入一点细微的甚至人眼无法察觉的改动后,被误分类为长臂猿。因此,希望可以有效地防御对抗攻击。然而,目前尚未发现有方案,可以同时兼顾上述两个问题。因此,迫切需要一种方案,可以同时实现保护数据的隐私安全和防御对抗攻击以保护模型安全。
技术实现思路
本说明书一个或多个实施例描述了一种保护数据隐私的图片分类方法及装置,可以同时实现保护隐私图片的数据隐私和防御针对图片分类模型的对抗攻击。根据第一方面,提供一种保护数据隐私的图片分类方法,所述方法的执行主体为数据持有方,所述数据持有方中存储多个隐私图片和对应的多个类别标签,所述方法包括:针对所述多个隐私图片中任意的第一隐私图片,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵;对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类。在一个实施例中,所述预定矩阵区域和预定变换构成预定的矩阵变换方式,在将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方之后,所述方法还包括:将所述矩阵变换方式发送至模型使用方,以使所述模型使用方根据所述矩阵变换方式,确定与所述目标图片对应的目标变换特征矩阵,进而将所述目标变换特征矩阵输入预先获取的所述图片分类模型中,得到针对所述目标图片的分类结果。在一个具体的实施例中,将所述矩阵变换方式发送至模型使用方,包括:利用加密密钥对所述矩阵变换方式进行加密,得到加密数据;将所述加密数据发送至所述模型使用方,以使所述模型使用方利用解密密钥对所述加密数据进行解密而得到所述矩阵变换方式。在一个实施例中,所述预定矩阵区域和预定变换构成预定的矩阵变换方式,所述多个变换特征矩阵和多个类别标签构成图片训练数据集,所述矩阵变换方式和所述图片训练数据集构成训练用数据包;其中,将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类,包括:将所述训练用数据包发送至模型训练方,以使其至少根据所述训练用数据包,以及从其他数据持有方接收的其他训练用数据包,训练出所述图片分类模型,用于对待分类的目标图片进行分类。根据第二方面,提供一种保护数据隐私的图片分类方法,所述方法的执行主体为模型使用方,所述方法包括:获取待分类的目标图片;确定所述目标图片对应的多个特征值,组成原始特征矩阵;对所述原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到变换特征矩阵,所述预定矩阵区域和预定变换是预先从数据持有方获取而得到;将所述变换特征矩阵输入预先获取的图片分类模型中,得到针对所述目标图片的分类结果,所述图片分类模型由模型训练方根据所述数据持有方发送的图片训练数据集进行训练而得到。根据第三方面,提供一种获取多个隐私图片和对应的多个类别标签;针对所述多个隐私图片中任意的第一隐私图片,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵;对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;利用得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签,训练图片分类模型,用于对目标图片进行分类。根据第四方面,提供一种保护数据隐私的图片分类方法,所述方法的执行主体为模型训练方,所述方法包括:接收多个数据持有方各自根据上述第一方面中提供的方法发送的训练用数据包,得到多个训练用数据包。针对其中任意的第一训练用数据包中的第一图片训练数据集,利用其训练出对应的第一老师图片分类模型,得到对应于所述多个训练用数据包的多个老师图片分类模型;获取预定数量的公用图片,针对其中任意的第一公用图片,确定与其对应的多个公用特征值,组成第一公用原始矩阵。利用所述第一公用原始矩阵,确定针对所述第一公用图片的多个分类结果,具体包括:对所述第一公用原始矩阵中位于第一预定矩阵区域的部分公用特征值,进行第一预定变换,得到第一公用变换矩阵,所述第一预定矩阵区域和第一预定变换来自所述第一训练用数据包中的第一矩阵变换方式;将所述第一公用变换矩阵输入所述第一老师图片分类模型中,得到针对所述第一公用图片的第一分类结果。对所述多个分类结果进行统计,得到针对不同分类结果的原始票数分布。在所述原始票数分布中添加拉普拉斯噪声,得到对应的添加后票数分布。基于所述添加后票数分布,确定其中最高票数所对应的分类结果,作为所述第一公用图片的第一类别标签。利用所述预定数量的公用图片,以及对应确定出的预定数量的类别标签,训练学生图片分类模型,用于对待分类的目标图片进行分类。根据第五方面,提供一种保护数据隐私的样本预测方法,所述方法的执行主体为数据持有方,所述数据持有方中存储针对业务对象的多个隐私样本和对应的多个样本标签,所述方法包括:针对所述多个隐私样本中任意的第一隐私样本,确定所述第一隐私样本对应的多个特征值,组成第一原始特征矩阵;对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;将得到的对应于所述多个隐私样本的多个变换特征矩阵,以及所述多个样本标签发送至模型训练方,以使其训练出针对所述业务对象的预测模型,用于对待预测的目标样本进行预测。根据第六方面,提供一种保护数据隐私的图片分类装置,所述装置集成于数据持有方,所述数据持有方中存储多个隐私图片和对应的多个类别标签,所述装置包括:矩阵确定单元,配置为针对所述多个隐私图片中任意的第一隐私图片,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵;矩阵变换单元,配置为对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;训练数据发送单元,配置为将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类。在一个实施例中,所述预定矩阵区域和预定变换构成预定的矩阵变换方式,所述多个变换特征矩阵和多个类别标签构成图片训练数据集,所述矩本文档来自技高网...

【技术保护点】
1.一种保护数据隐私的图片分类方法,所述方法的执行主体为数据持有方,所述数据持有方中存储多个隐私图片和对应的多个类别标签,所述方法包括:/n针对所述多个隐私图片中任意的第一隐私图片,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵;/n对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;/n将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类。/n

【技术特征摘要】
1.一种保护数据隐私的图片分类方法,所述方法的执行主体为数据持有方,所述数据持有方中存储多个隐私图片和对应的多个类别标签,所述方法包括:
针对所述多个隐私图片中任意的第一隐私图片,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵;
对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;
将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类。


2.根据权利要求1所述的方法,其中,确定与所述第一隐私图片对应的多个特征值,包括:
将所述第一隐私图片中多个像素所对应的多个像素值,确定为所述多个特征值。


3.根据权利要求1或2所述的方法,其中,所述预定矩阵区域对应若干列编号和/或若干行编号;其中,对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵,包括:
从所述第一原始特征矩阵中删除与所述若干列编号对应的若干列特征值,和/或,删除与所述若干行编号对应的若干行特征值,得到所述第一变换特征矩阵。


4.根据权利要求3所述的方法,其中,所述预定矩阵区域基于以下步骤预先确定:
基于任意原始特征矩阵具有的总列数,随机确定出不大于所述总列数的若干数值,作为所述若干列编号;和/或,
基于任意原始特征矩阵具有的总行数,随机确定出不大于所述总行数的若干数值,作为所述若干行编号。


5.根据权利要求1或2所述的方法,其中,所述预定矩阵区域对应多个列编号,所述部分特征值包括对应所述多个列编号的多列特征值;
其中,对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵,包括:
按照基于所述多个列编号设定的列间位置互换方式,对所述多列特征值进行位置互换,得到所述第一变换特征矩阵。


6.根据权利要求1所述的方法,其中,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵,包括:
利用所述第一隐私图片中多个像素所对应的多个像素值,构造第一像素矩阵;
对所述第一像素矩阵进行分块处理,得到对应的多个像素矩阵分块;
对所述多个像素矩阵分块分别进行离散余弦变换DCT处理,得到对应的多个处理矩阵分块,组成所述第一原始特征矩阵。


7.根据权利要求6所述的方法,其中,所述预定矩阵区域对应若干分块编号,所述部分特征值包括与所述若干分块编号对应的若干处理矩阵分块中的各个特征值;其中,对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵,包括:
将所述若干处理矩阵分块中的各个特征值,对应更改为其自身的相反数,得到所述第一变换特征矩阵。


8.根据权利要求1所述的方法,其中,在将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方之后,所述方法还包括:
从所述模型训练方接收所述图片分类模型;
获取所述目标图片,并确定所述目标图片对应的目标变换特征矩阵;
将所述目标变换特征矩阵输入所述图片分类模型,得到针对所述目标图片的分类结果。


9.根据权利要求1所述的方法,其中,所述预定矩阵区域和预定变换构成预定的矩阵变换方式,在将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方之后,所述方法还包括:
将所述矩阵变换方式发送至模型使用方,以使所述模型使用方根据所述矩阵变换方式,确定与所述目标图片对应的目标变换特征矩阵,进而将所述目标变换特征矩阵输入预先获取的所述图片分类模型中,得到针对所述目标图片的分类结果。


10.根据权利要求9所述的方法,其中,将所述矩阵变换方式发送至模型使用方,包括:
利用加密密钥对所述矩阵变换方式进行加密,得到加密数据;
将所述加密数据发送至所述模型使用方,以使所述模型使用方利用解密密钥对所述加密数据进行解密而得到所述矩阵变换方式。


11.根据权利要求1所述的方法,其中,所述预定矩阵区域和预定变换构成预定的矩阵变换方式,所述多个变换特征矩阵和多个类别标签构成图片训练数据集,所述矩阵变换方式和所述图片训练数据集构成训练用数据包;
其中,将得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签发送至模型训练方,以使其训练出图片分类模型,用于对待分类的目标图片进行分类,包括:
将所述训练用数据包发送至模型训练方,以使其至少根据所述训练用数据包,以及从其他数据持有方接收的其他训练用数据包,训练出所述图片分类模型,用于对待分类的目标图片进行分类。


12.一种保护数据隐私的图片分类方法,所述方法的执行主体为模型使用方,所述方法包括:
获取待分类的目标图片;
确定所述目标图片对应的多个特征值,组成原始特征矩阵;
对所述原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到变换特征矩阵,所述预定矩阵区域和预定变换是预先从数据持有方获取而得到;
将所述变换特征矩阵输入预先获取的图片分类模型中,得到针对所述目标图片的分类结果,所述图片分类模型由模型训练方根据所述数据持有方发送的图片训练数据集进行训练而得到。


13.一种保护数据隐私的图片分类方法,包括:
获取多个隐私图片和对应的多个类别标签;
针对所述多个隐私图片中任意的第一隐私图片,确定与所述第一隐私图片对应的多个特征值,组成第一原始特征矩阵;
对所述第一原始特征矩阵中位于预定矩阵区域的部分特征值,进行预定变换,得到第一变换特征矩阵;
利用得到的对应于所述多个隐私图片的多个变换特征矩阵,以及所述多个类别标签,训练图片分类模型,用于对目标图片进行分类。


14.一种保护数据隐私的图片分类方法,所述方法的执行主体为模型训练方,所述方法包括:
接收多个数据持有方各自根据权利要求11所述的方法发送的训练用数据包,得到多个训练用数据包;
针对其中任意的第一训练用数据包中的第一图片训练数据集,利用其训练出对应的第一老师图片分类模型,得到对应于所述多个训练用数据包的多个老师图片分类模型;
获取预定数量的公用图片,针对其中任意的第一公用图片,确定与其对应的多个公用特征值,组成第一公用原始矩阵;
利用所述第一公用原始矩阵,确定针对所述第一公用图片的多个分类结果,具体包括:
对所述第一公用原始矩阵中位于第一预定矩阵区域的部分公用特征值,进行第一预定变换,得到第一公用变换矩阵,所述第一预定矩阵区域和第一预定变换来自所述第一训练用数据包中的第一矩阵变换方式;
将所述第一公用变换矩阵输入所述第一老师图片分类模型中,得到针对所述第一公用图片的第一分类结果...

【专利技术属性】
技术研发人员:熊涛
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1