一种基于联邦学习社交媒体用户隐私信息保护方法和系统技术方案

技术编号:32188375 阅读:12 留言:0更新日期:2022-02-08 15:52
本发明专利技术提供一种基于联邦学习的社交媒体用户隐私信息保护方法和保护系统,包括:确定初始通用目标识别模型,并发送至参与联邦学习的智能移动设备;利用本地数据集,对各智能移动设备的模型参数进行更新;根据各智能移动设备的数据集占比,对更新后的模型参数进行加权平均,并更新模型参数;实时监测各智能移动设备自身数据集变化情况,并更新本地数据集;当设备数量或本地数据集出现变化时,更新各智能移动设备的模型参数;根据更新后的智能移动设备的模型参数对图像中的隐私信息进行识别,并基于高斯滤波对其进行打码处理。该方法可在保证用户数据隐私的前提下,实现对图像、视频中隐私信息的保护,具有即时响应、保护隐私、适用场景多样的优点。场景多样的优点。场景多样的优点。

【技术实现步骤摘要】
一种基于联邦学习社交媒体用户隐私信息保护方法和系统


[0001]本专利技术涉及联邦学习与图像隐私保护
,具体涉及一种基于联邦学习社交媒体用户隐私信息保护方法和系统。

技术介绍

[0002]微信、微博等社交软件的盛行,使得图像、视频成为社交网络的主要媒介。同时,随着大数据时代的到来以及人工智能领域的快速发展,利用大量用户数据进行训练分析成为了提高算法准确率的一个重要途径。因此大量的用户个人信息被传输给不同的算法和系统,甚至一些第三方应用未经用户授权就私自使用用户数据,这些都极大的增加了用户个人信息泄露的风险。
[0003]谷歌提出的联邦学习作为新兴的人工智能算法,具有即时响应、保护隐私等优点。联邦学习意味着将训练数据留在客户端本地,不需要再收集、存储数据到云端,这一做法大大减少了个人敏感信息泄漏的风险。
[0004]目前,现有针对社交媒体中用户隐私信息的保护方法仍然基于用户自己进行判断及打码,方法简单低效。基于深度神经网络模型的用户隐私信息自动识别策略在训练过程中高度依赖中央服务器,对用户的隐私数据进行集中采集和标注处理,集中训练过程仍然存在着泄漏用户隐私信息的巨大风险。
[0005]为此,本专利技术提出了一种新的基于联邦学习社交媒体用户隐私信息保护方法和系统。

技术实现思路

[0006]为解决上述问题,本专利技术的目的是提供一种基于联邦学习社交媒体用户隐私信息保护系统及其方法,旨在解决现有深度学习模型在集中训练时产生的用户数据泄露及模型应用场景单一等问题,为用户提供更全面、有效的隐私保护服务,充分利用各智能移动设备的本地数据,使模型的适用场景更加广泛,具有即时响应、保护隐私、适用场景多样的优点。
[0007]为实现上述目的,本专利技术提供了如下的技术方案。
[0008]一种基于联邦学习社交媒体用户隐私信息保护方法,包括以下步骤:
[0009]确定初始通用目标识别模型,并将目标识别模型发送至参与联邦学习的智能移动设备;
[0010]利用本地数据集,对各智能移动设备的目标识别模型参数进行更新;
[0011]根据各智能移动设备的数据集占比,对更新后的目标识别模型参数进行加权平均操作,并更新各智能移动设备的目标识别模型参数;
[0012]实时监测各智能移动设备自身数据集变化情况,并更新本地数据集;当设备数量或本地数据集出现变化时,更新各智能移动设备的目标识别模型参数;
[0013]根据更新后的智能移动设备的目标识别模型参数对图像中的隐私信息进行识别,并基于高斯滤波对其进行打码处理。
[0014]优选地,所述确定初始通用目标识别模型,包括:
[0015]通过初始化代码对参与联邦学习的智能移动设备及目标识别模型进行设定;
[0016]通过通信框架将所选目标识别模型发送给各智能移动设备。
[0017]优选地,所述利用本地数据集,对各智能移动设备的目标识别模型参数进行更新,包括:
[0018]依据对用户行为判断或手动标记的方式,对各智能移动设备的数据集进行类别标定,将标定数据作为本地训练集;
[0019]对各智能移动设备利用格式转换代码,将训练集的标定数据转换为xml文件,传入选用的目标识别模型中进行训练;
[0020]当各智能移动设备达到指定训练轮次时,对选用的目标识别模型的参数进行更新:
[0021][0022]其中,k为当前参与联邦学习的移动设备的编号,为t时刻设备k的模型参数,η为参数更新时的学习率,g
k
为设备k在当前参数下的梯度值。
[0023]优选地,所述对更新后的目标识别模型参数进行加权平均操作,包括:
[0024]对各移动设备训练集所占比例进行计算:
[0025][0026]其中,γ
k
为设备k的加权系数,n
k
为设备k的训练集数量,n为参与联邦学习的设备的训练集数量总和;
[0027]对更新后的目标识别模型参数进行加权平均:
[0028][0029]其中,K为参与联邦学习的设备总量,W
t+1
为t+1时刻服务器端的模型参数,为t+1时刻设备k的模型参数。
[0030]一种基于联邦学习社交媒体用户隐私信息保护系统,包括:
[0031]通用目标识别模型部署模块,通过服务器端将初始深度模型发送给每个参与联邦学习的智能移动设备;
[0032]用户隐私数据本地训练模块,将各智能移动设备基于本地用户隐私数据输入到初始深度学习模型中,在用户所持智能移动设备中进行训练;
[0033]智能移动终端模型参数融合模块,通过服务器端收集各智能移动设备发送的目标识别模型参数,按照参与训练数据类型及比例,对模型参数进行加权处理,更新通用目标识别模型的参数;
[0034]目标识别模型更新模块,通过服务器端将加权后的目标识别模型参数发送给各智能移动设备,实时监测本地数据变化情况,若本地产生新的数据,则将其加入本地训练集中,并持续更新目标识别模型参数;
[0035]隐私信息识别及保护模块,利用最终更新的目标识别模型对隐私信息进行识别,基于高斯滤波实现对隐私信息的打码处理。
[0036]优选地,所述用户隐私数据本地训练模块中的模型训练,包括以下步骤:
[0037]通过推断或用户手动标记等方式,对各智能移动设备的本地数据集进行类别标记,将其作为本地训练集;
[0038]将已标记的数据输入到通用模型中,对神经网络中的权重进行更新,将更新后的参数存储在本地。
[0039]优选地,所述智能移动终端模型参数融合模块更新目标识别模型的参数,包括以下步骤:
[0040]各智能移动设备完成相应的迭代后,将模型的更新参数发送给服务器端;
[0041]当服务器端接收到指定数量的参与本轮更新的智能移动设备所发送的参数时,对其进行存储
[0042]按照各智能移动设备中本地训练集占总体训练集的比例,对发送的模型更新参数进行加权平均。
[0043]优选地,所述目标识别模型更新模块的目标识别模型的参数,包括以下步骤:
[0044]各设备基于本地数据集对模型参数进行持续迭代更新,同时,各智能移动设备需要实时监测自身数据集的变化状况,及时更新本地训练集;
[0045]各移动设备持续更新,直到服务器端的模型收敛;
[0046]将最终训练好的模型参数发送给各移动端进行参数更新,同时当新的移动用户加入或移动设备上传新的参数时对服务器端模型进行更新。
[0047]本专利技术有益效果:
[0048]本专利技术提供基于联邦学习社交媒体用户隐私信息保护方法和系统,针对集中学习下的图像隐私保护问题,基于联邦学习、深度学习及高斯滤波,在保证模型准确率的前提下,对用户本地的数据及图像、视频中的隐私信息进行了有效的保护。通过对各设备本地数据集的学习,最终得到泛化能力较强的模型。基于联邦学习更新参数、深度学习模型识别图像、高斯滤波信息打码本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习社交媒体用户隐私信息保护方法,其特征在于,包括以下步骤:确定初始通用目标识别模型,并将目标识别模型发送至参与联邦学习的智能移动设备;利用本地数据集,对各智能移动设备的目标识别模型参数进行更新;根据各智能移动设备的数据集占比,对更新后的目标识别模型参数进行加权平均操作,并更新各智能移动设备的目标识别模型参数;实时监测各智能移动设备自身数据集变化情况,并更新本地数据集;当设备数量或本地数据集出现变化时,更新各智能移动设备的目标识别模型参数;根据更新后的智能移动设备的目标识别模型参数对图像中的隐私信息进行识别,并基于高斯滤波对其进行打码处理。2.根据权利要求1所述的基于联邦学习社交媒体用户隐私信息保护方法,其特征在于,所述确定初始通用目标识别模型,包括:通过初始化代码对参与联邦学习的智能移动设备及目标识别模型进行设定;通过通信框架将所选目标识别模型发送给各智能移动设备。3.根据权利要求1所述的基于联邦学习社交媒体用户隐私信息保护方法,其特征在于,所述利用本地数据集,对各智能移动设备的目标识别模型参数进行更新,包括:依据对用户行为判断或手动标记的方式,对各智能移动设备的数据集进行类别标定,将标定数据作为本地训练集;对各智能移动设备利用格式转换代码,将训练集的标定数据转换为xml文件,传入选用的目标识别模型中进行训练;当各智能移动设备达到指定训练轮次时,对选用的目标识别模型的参数进行更新:其中,k为当前参与联邦学习的移动设备的编号,为t时刻设备k的模型参数,η为参数更新时的学习率,g
k
为设备k在当前参数下的梯度值。4.根据权利要求3所述的基于联邦学习社交媒体用户隐私信息保护方法,其特征在于,所述对更新后的目标识别模型参数进行加权平均操作,包括:对各移动设备训练集所占比例进行计算:其中,γ
k
为设备k的加权系数,n
k
为设备k的训练集数量,n为参与联邦学习的设备的训练集数量总和;对更新后的目标识别模型参数进行加权平均:其中,K为参与联邦学习的设备总量,W
t+1
为t+1时刻服务器端的模型参数,为t+1时刻设备k的模型参数。<...

【专利技术属性】
技术研发人员:任杰侯佳乐贾晨鸽王煜华马苗
申请(专利权)人:陕西师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1