生成对抗网络公平性分析方法、系统、设备及存储介质技术方案

技术编号:33835304 阅读:14 留言:0更新日期:2022-06-16 11:49
本发明专利技术属于机器学习领域,公开了一种生成对抗网络公平性分析方法、系统、设备及存储介质,包括以下步骤:分析待分析属性,构建属性分类器;分析待分析生成对抗网络能否获取大量生成样本;能则获取并收集待分析生成对抗网络的大量生成样本;否则根据待分析生成对抗网络的特点,在本地构建影子模型,并利用影子模型优化待分析生成对抗网络的输入噪音,再用优化噪音,获取并收集待分析生成对抗网络的少量生成样本;利用属性分类器与属性提取函数实现待分析生成对抗网络的公平性分析。该分析方法根据待分析生成对抗网络的实际使用场景,构建了基于大量样本以及少量优化样本的两种分析流程,有效提升待分析生成对抗网络公平性分析的适用性与成功率。用性与成功率。用性与成功率。

【技术实现步骤摘要】
生成对抗网络公平性分析方法、系统、设备及存储介质


[0001]本专利技术属于机器学习领域,涉及一种生成对抗网络公平性分析方法、系统、设备及存储介质。

技术介绍

[0002]近年来,深度生成模型的相关理论研究取得了巨大突破。其中,以生成对抗网络以及变分自编码器为代表的深度生成模型,不但具有强大的数据分布学习能力,也为高质量数据样本的生成提供了可能。除了作为面向小样本学习的数据增强技术,深度生成模型在视频换脸、音乐合成、风格转换等多类信息合成任务上,也表现出了卓越的性能。在深度生成模型被成功应用于医学图像重建、人像增强与识别等关键
的同时,深度生成模型的公平性逐渐得到广泛关注。
[0003]而在深度生成模型被成功应用于医学图像重建、人像增强与识别等关键
的同时,临床数据、人脸照片等敏感信息的隐私保护问题也逐渐得到公众、社会和各国政府的广泛关注。当前的研究工作表明,即便作为黑盒服务运行,机器学习系统的训练数据或内部模型信息仍然可能会遭到多种形式的攻击进而导致隐私泄漏,典型的有面向数据隐私的模型逆向攻击,以及面向模型隐私的模型萃取攻击。训练数据的泄露可能会直接侵犯用户的数据隐私,而模型信息的泄露将可能会造成服务提供商的经济损失,攻击者甚至还可以通过此来分析被窃取模型的弱点,发动进一步的攻击,如对抗样本攻击。
[0004]因此,目前的生成对抗网络加强对训练数据集的隐私保护,而这在一定程度上导致使用者无法确定其训练数据集是否在某些属性上存在歧视,如数据集在某一属性上的不平等,继而导致无法有效判断生成对抗网络的公平性,而部分机器学习模型的训练过程依赖于生成对抗网络生成的样本,通过不公平的生成对抗网络生成的数据训练的机器学习模型,很可能继承敏感属性的偏见,如年龄、性别、肤色和地区,进而导致机器学习模型存在严重的歧视效应与严重的公平性问题,继而引起了人们对其在现实世界中应用的担忧。

技术实现思路

[0005]本专利技术的目的在于克服上述现有技术的缺点,提供一种生成对抗网络公平性分析方法、系统、设备及存储介质。
[0006]为达到上述目的,本专利技术采用以下技术方案予以实现:
[0007]本专利技术第一方面,一种生成对抗网络公平性分析方法,包括:
[0008]S1:获取待分析属性,并构建待分析属性的属性分类器;
[0009]S2:获取待分析生成对抗网络,当待分析生成对抗网络允许被获取至少第一预设数量的生成样本时,进行S6;否则,进行S3;
[0010]S3:获取待分析生成对抗网络的结构特点及训练目标,根据待分析生成对抗网络的结构特点及训练目标,构建待分析生成对抗网络的若干影子模型,并以训练集中待分析属性的比例分布按照0%~100%的要求构建若干影子模型的训练集;
[0011]S4:获取待分析生成对抗网络的输入噪音,并通过若干影子模型和待分析属性的属性分类器优化待分析生成对抗网络的输入噪音,得到优化噪音;
[0012]S5:通过优化噪音查询待分析生成对抗网络,得到第二预设数量的生成样本;
[0013]S6:通过待分析属性的属性分类器,得到各生成样本为待分析属性的置信度,并根据各生成样本为待分析属性的置信度,通过预设的属性提取函数,得到生成样本中待分析属性的分布,作为待分析生成对抗网络训练集中待分析属性的分布;
[0014]S7:根据待分析生成对抗网络训练集中待分析属性的分布,确定待分析生成对抗网络的公平性。
[0015]可选的,所述S4具体包括:
[0016]S401:随机选取一影子模型,将输入噪音输入当前影子模型,生成当前影子模型的若干影子生成样本;
[0017]S402:采用待分析属性的属性分类器,得到当前影子生成样本为待分析属性的置信度,并根据当前影子生成样本为待分析属性的置信度,通过预设的属性提取函数,得到当前影子模型的训练集中待分析属性的预测比例;
[0018]S403:根据当前影子模型的训练集中待分析属性的预测比例以及待分析属性的实际比例,构建损失函数并通过损失函数优化输入噪音,得到优化的输入噪音;
[0019]S404:采用优化的输入噪音替换原始输入噪音,并迭代进行S201~S203,至达到预设迭代次数或待分析属性的预测比例与待分析属性的实际比例之间的误差在预设范围内,将当前优化的输入噪音作为优化噪音输出。
[0020]可选的,所述预设的属性提取函数为均值计算函数。
[0021]可选的,所述损失函数为当前影子模型的训练集中待分析属性的预测比例与待分析属性的实际比例差的平方。
[0022]可选的,所述第一预设数量为5000以上,第二预设数量为100~150。
[0023]可选的,所述待分析生成对抗网络的结构特点包括待分析生成对抗网络的网络结构以及训练过程,所述根据待分析生成对抗网络的结构特点及训练目标,构建待分析生成对抗网络的若干影子模型时,各影子模型的网络结构、训练过程以及训练目标均与待分析生成对抗网络相同。
[0024]本专利技术第二方面,一种生成对抗网络公平性分析系统,包括第一获取模块、第二获取模块、影子模型构建模块、优化模块、查询模块、分布分析模块以及公平性分析模块;其中:
[0025]第一获取模块,用于获取待分析属性,并构建待分析属性的属性分类器;
[0026]第二获取模块,用于获取待分析生成对抗网络,当待分析生成对抗网络允许被获取至少第一预设数量的生成样本时,触发分布分析模块;否则,触发影子模型构建模块;
[0027]影子模型构建模块,用于获取待分析生成对抗网络的结构特点及训练目标,根据待分析生成对抗网络的结构特点及训练目标,构建待分析生成对抗网络的若干影子模型,并以训练集中待分析属性的比例分布按照0%~100%的要求构建若干影子模型的训练集;
[0028]优化模块,用于获取待分析生成对抗网络的输入噪音,并通过若干影子模型和待分析属性的属性分类器优化待分析生成对抗网络的输入噪音,得到优化噪音;
[0029]查询模块,用于通过优化噪音查询待分析生成对抗网络,得到第二预设数量的生
成样本;
[0030]分布分析模块,用于通过待分析属性的属性分类器,得到各生成样本为待分析属性的置信度,并根据各生成样本为待分析属性的置信度,通过预设的属性提取函数,得到生成样本中待分析属性的分布,作为待分析生成对抗网络训练集中待分析属性的分布;
[0031]公平性分析模块,用于根据待分析生成对抗网络训练集中待分析属性的分布,确定待分析生成对抗网络的公平性。
[0032]可选的,所述优化模块包括迭代模块和迭代控制模块;其中:
[0033]迭代模块用于随机选取一影子模型,将输入噪音输入当前影子模型,生成当前影子模型的若干影子生成样本;采用待分析属性的属性分类器,得到各影子生成样本为待分析属性的置信度,并根据各影子生成样本为待分析属性的置信度,通过预设的属性提取函数,得到当前影子模型的训练集中待分析属性的预测比例;根据当前影子本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成对抗网络公平性分析方法,其特征在于,包括:S1:获取待分析属性,并构建待分析属性的属性分类器;S2:获取待分析生成对抗网络,当待分析生成对抗网络允许被获取至少第一预设数量的生成样本时,进行S6;否则,进行S3;S3:获取待分析生成对抗网络的结构特点及训练目标,根据待分析生成对抗网络的结构特点及训练目标,构建待分析生成对抗网络的若干影子模型,并以训练集中待分析属性的比例分布按照0%~100%的要求构建若干影子模型的训练集;S4:获取待分析生成对抗网络的输入噪音,并通过若干影子模型和待分析属性的属性分类器优化待分析生成对抗网络的输入噪音,得到优化噪音;S5:通过优化噪音查询待分析生成对抗网络,得到第二预设数量的生成样本;S6:通过待分析属性的属性分类器,得到各生成样本为待分析属性的置信度,并根据各生成样本为待分析属性的置信度,通过预设的属性提取函数,得到生成样本中待分析属性的分布,作为待分析生成对抗网络训练集中待分析属性的分布;S7:根据待分析生成对抗网络训练集中待分析属性的分布,确定待分析生成对抗网络的公平性。2.根据权利要求1所述的生成对抗网络公平性分析方法,其特征在于,所述S4具体包括:S401:随机选取一影子模型,将输入噪音输入当前影子模型,生成当前影子模型的若干影子生成样本;S402:采用待分析属性的属性分类器,得到当前影子生成样本为待分析属性的置信度,并根据当前影子生成样本为待分析属性的置信度,通过预设的属性提取函数,得到当前影子模型的训练集中待分析属性的预测比例;S403:根据当前影子模型的训练集中待分析属性的预测比例以及待分析属性的实际比例,构建损失函数并通过损失函数优化输入噪音,得到优化的输入噪音;S404:采用优化的输入噪音替换原始输入噪音,并迭代进行S201~S203,至达到预设迭代次数或待分析属性的预测比例与待分析属性的实际比例之间的误差在预设范围内,将当前优化的输入噪音作为优化噪音输出。3.根据权利要求1或2所述的生成对抗网络公平性分析方法,其特征在于,所述预设的属性提取函数为均值计算函数。4.根据权利要求2所述的生成对抗网络公平性分析方法,其特征在于,所述损失函数为当前影子模型的训练集中待分析属性的预测比例与待分析属性的实际比例差的平方。5.根据权利要求2所述的生成对抗网络公平性分析方法,其特征在于,所述第一预设数量为5000以上,第二预设数量为100~150。6.根据权利要求2所述的生成对抗网络公平性分析方法,其特征在于,所述待分析生成对抗网络的结构特点包括待分析生成对抗网络的网络结构以及训练过程,所述根据待分析生成对抗网络的结构特点及训练目标,构建待分析生成对抗网络的若干影子模型时,各影子模型的网络结构、训练过程以...

【专利技术属性】
技术研发人员:沈超周君豪蔺琛皓管晓宏
申请(专利权)人:西安交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1