System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于差分隐私的噪声生成方法、装置、终端和介质制造方法及图纸_技高网

一种基于差分隐私的噪声生成方法、装置、终端和介质制造方法及图纸

技术编号:44899283 阅读:8 留言:0更新日期:2025-04-08 18:47
本申请公开了一种基于差分隐私的噪声生成方法、装置、终端和介质,应用于数据中台,所述数据中台包括数据文件库以及服务器,所述数据文件库用于存储原始数据文件以及原始数据文件对应的文件标签所述方法包括:根据原始数据文件中的被查询数据的数据特征,确定被查询数据对应的数据敏感度;根据所述被查询数据以及所述文件标签,确定被查询数据对应的隐私参数;根据数据敏感度以及隐私参数,确定被查询数据对应的尺度参数;通过预设噪声生成模型,根据所述尺度参数以及所述文件标签,得到目标噪声数据。本申请旨在生成高质量的噪声数据,以保护数据的隐私性。

【技术实现步骤摘要】

本申请涉及数据隐私保护领域,尤其涉及一种基于差分隐私的噪声生成方法、装置、终端和介质


技术介绍

1、差分隐私(differential privacy)是一种用于保护个人隐私的数学框架。旨在允许对数据库进行统计分析的同时,保护个体数据的安全性和隐私性,即使攻击者拥有除一个特定记录外的所有数据副本,也无法确定该特定记录是否存在或其具体内容。

2、然而,针对数据文件中需要保护的数据,现有的数据隐私保护方式存在以下不足之处:无法准确地根据用户对于保密等级的需求以及数据所在的具体实际场景来为被保护数据提供更适合的噪声数据,从而导致被保护数据的隐私性保护不足,或者,导致被保护数据在应用过程中出现失真严重的问题。


技术实现思路

1、本申请的主要目的在于提供一种基于差分隐私的噪声生成方法、装置、终端和介质,旨在生成高质量的噪声数据,以保护数据的隐私性。

2、为实现上述目的,本申请提供一种基于差分隐私的噪声生成方法,应用于数据中台,所述数据中台包括数据文件库以及服务器,所述数据文件库用于存储原始数据文件以及原始数据文件对应的文件标签,所述文件标签用于表征所述原始数据文件中数据的状况,所述数据文件库以及服务器均处于同一网络中;

3、所述方法包括:

4、根据所述原始数据文件中的被查询数据的数据特征,确定被查询数据对应的数据敏感度;

5、根据所述被查询数据以及所述文件标签,确定被查询数据对应的隐私参数;

6、根据数据敏感度以及隐私参数,确定被查询数据对应的尺度参数;

7、通过预设噪声生成模型,根据所述尺度参数以及所述文件标签,得到目标噪声数据,以保护所述被查询数据的隐私性。

8、具体地,所述文件标签包括合规等级标签、保密期望标签以及应用场景标签,所述合规等级标签用于表征所述原始数据文件中的内容适用行业特定数据保护标准的状况,所述保密期望标签用于表征原始数据文件对应的用户对于所述原始数据文件的保密等级的期望程度,所述应用场景标签用于表征所述原始数据文件中的内容所在的应用场景;

9、所述根据所述被查询数据以及所述文件标签,确定被查询数据对应的隐私参数,包括:

10、通过预设隐私参数生成模型,根据所述被查询数据、合规等级标签、保密期望标签以及所述应用场景标签,得到所述隐私参数。

11、具体地,所述预设隐私参数生成模型包括第一输入层、第一嵌入层、第二嵌入层、第三嵌入层、第一特征融合层、全连接层;

12、所述通过预设隐私参数生成模型,根据所述被查询数据、合规等级标签、保密期望标签以及所述应用场景标签,得到所述隐私参数,包括:

13、通过所述第一输入层,根据所述被查询数据,得到被查询数据对应的输入向量;

14、通过所述第一嵌入层,通过所述合规等级标签,得到合规等级标签向量;

15、通过所述第二嵌入层,通过所述保密期望标签,得到保密期望标签向量;

16、通过所述第三嵌入层,通过所述应用场景标签,得到应用场景标签向量;

17、通过所述第一特征融合层,根据所述被查询数据对应的输入向量、所述合规等级标签向量、所述保密期望标签向量以及所述应用场景标签向量,得到第一特征融合向量;

18、通过所述全连接层,根据所述第一特征融合向量,得到所述隐私参数。

19、具体地,所述全连接层包括第一子全连接层、第二子全连接层以及第三子全连接层,所述第一子全连接层的激活函数以及所述第二子全连接层的激活函数均为relu函数,所述第三子全连接层的激活函数为sigmoid函数;

20、所述通过所述全连接层,根据所述第一特征融合向量,得到所述隐私参数,包括:

21、通过所述第一子全连接层,根据所述第一特征融合向量,得到第一中间向量;

22、通过所述第二子全连接层,根据所述第一中间向量,得到第二中间向量;

23、通过所述第三子全连接层,根据所述第二中间向量,得到所述隐私参数。

24、具体地,所述根据数据敏感度以及隐私参数,确定被查询数据对应的尺度参数,包括:

25、基于预设尺度参数计算公式,根据所述数据敏感度以及所述隐私参数,计算得到所述尺度参数。

26、具体地,所述预设噪声生成模型包括第二输入层、第四嵌入层、第二特征融合层、卷积层、lstm层、第四子全连接层、第五子全连接层以及第六子全连接层,所述第四子全连接层的激活函数以及所述第五子全连接层的激活函数均为relu函数,所述第六子全连接层的激活函数为线性激活函数;

27、所述通过预设噪声生成模型,根据所述尺度参数以及所述文件标签,得到目标噪声数据,以保护所述被查询数据的隐私性,包括:

28、通过所述第二输入层,根据所述尺度参数,得到尺度参数向量;

29、通过所述第四嵌入层,根据所述文件标签,得到文件标签向量;

30、通过所述第二特征融合层,根据所述文件标签向量以及所述尺度参数向量,得到第二特征融合向量;

31、通过所述卷积层,根据所述第二特征融合向量,得到卷积特征图;

32、通过所述lstm层,根据所述卷积特征图,得到lstm特征向量;

33、通过所述第四子全连接层,根据所述lstm特征向量,得到第三中间向量;

34、通过所述第五子全连接层,根据所述第三中间向量,得到第四中间向量;

35、通过所述第六子全连接层,根据所述第四中间向量,得到目标噪声数据。

36、具体地,在所述根据所述原始数据文件中的被查询数据的数据特征,确定被查询数据对应的数据敏感度之前,所述方法还包括:

37、响应于接收到的数据查询指令,从所述数据集文件库中的原始数据文件中调取所述被查询数据。

38、为实现上述目的,本申请还提供一种基于差分隐私的噪声生成装置,应用于数据中台,所述数据中台包括数据文件库以及服务器,所述数据文件库用于存储原始数据文件以及原始数据文件对应的文件标签,所述文件标签用于表征所述原始数据文件中数据的状况,所述数据文件库以及服务器均处于同一网络中;

39、所述装置包括:

40、第一单元,用于根据所述原始数据文件中的被查询数据的数据特征,确定被查询数据对应的数据敏感度;

41、第二单元,用于根据所述被查询数据以及所述文件标签,确定被查询数据对应的隐私参数;

42、第三单元,用于根据数据敏感度以及隐私参数,确定被查询数据对应的尺度参数;

43、第四单元,用于通过预设噪声生成模型,根据所述尺度参数以及所述文件标签,得到目标噪声数据,以保护所述被查询数据的隐私性。

44、为实现上述目的,本申请还提供一种终端,包括存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行本申请所提供的任一种方法中的步骤。

45、为实现本文档来自技高网...

【技术保护点】

1.一种基于差分隐私的噪声生成方法,其特征在于,应用于数据中台,所述数据中台包括数据文件库以及服务器,所述数据文件库用于存储原始数据文件以及原始数据文件对应的文件标签,所述文件标签用于表征所述原始数据文件中数据的状况,所述数据文件库以及服务器均处于同一网络中;

2.如权利要求1所述的方法,其特征在于,所述文件标签包括合规等级标签、保密期望标签以及应用场景标签,所述合规等级标签用于表征所述原始数据文件中的内容适用行业特定数据保护标准的状况,所述保密期望标签用于表征原始数据文件对应的用户对于所述原始数据文件的保密等级的期望程度,所述应用场景标签用于表征所述原始数据文件中的内容所在的应用场景;

3.如权利要求2所述的方法,其特征在于,所述预设隐私参数生成模型包括第一输入层、第一嵌入层、第二嵌入层、第三嵌入层、第一特征融合层、全连接层;

4.如权利要求3所述的方法,其特征在于,所述全连接层包括第一子全连接层、第二子全连接层以及第三子全连接层,所述第一子全连接层的激活函数以及所述第二子全连接层的激活函数均为ReLU函数,所述第三子全连接层的激活函数为Sigmoid函数;

5.如权利要求1所述的方法,其特征在于,所述根据数据敏感度以及隐私参数,确定被查询数据对应的尺度参数,包括:

6.如权利要求1所述的方法,其特征在于,所述预设噪声生成模型包括第二输入层、第四嵌入层、第二特征融合层、卷积层、LSTM层、第四子全连接层、第五子全连接层以及第六子全连接层,所述第四子全连接层的激活函数以及所述第五子全连接层的激活函数均为ReLU函数,所述第六子全连接层的激活函数为线性激活函数;

7.如权利要求1所述的方法,其特征在于,在所述根据所述原始数据文件中的被查询数据的数据特征,确定被查询数据对应的数据敏感度之前,所述方法还包括:

8.一种基于差分隐私的噪声生成装置,其特征在于,应用于数据中台,所述数据中台包括数据文件库以及服务器,所述数据文件库用于存储原始数据文件以及原始数据文件对应的文件标签,所述文件标签用于表征所述原始数据文件中数据的状况,所述数据文件库以及服务器均处于同一网络中;

9.一种终端,其特征在于,包括处理器和存储器,所述存储器存储有多条指令;所述处理器从所述存储器中加载指令,以执行如权利要求1~7任一项所述方法中的步骤。

10.一种介质,其特征在于,所述介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1~7任一项所述方法中的步骤。

...

【技术特征摘要】

1.一种基于差分隐私的噪声生成方法,其特征在于,应用于数据中台,所述数据中台包括数据文件库以及服务器,所述数据文件库用于存储原始数据文件以及原始数据文件对应的文件标签,所述文件标签用于表征所述原始数据文件中数据的状况,所述数据文件库以及服务器均处于同一网络中;

2.如权利要求1所述的方法,其特征在于,所述文件标签包括合规等级标签、保密期望标签以及应用场景标签,所述合规等级标签用于表征所述原始数据文件中的内容适用行业特定数据保护标准的状况,所述保密期望标签用于表征原始数据文件对应的用户对于所述原始数据文件的保密等级的期望程度,所述应用场景标签用于表征所述原始数据文件中的内容所在的应用场景;

3.如权利要求2所述的方法,其特征在于,所述预设隐私参数生成模型包括第一输入层、第一嵌入层、第二嵌入层、第三嵌入层、第一特征融合层、全连接层;

4.如权利要求3所述的方法,其特征在于,所述全连接层包括第一子全连接层、第二子全连接层以及第三子全连接层,所述第一子全连接层的激活函数以及所述第二子全连接层的激活函数均为relu函数,所述第三子全连接层的激活函数为sigmoid函数;

5.如权利要求1所述的方法,其特征在于,所述根据数据敏感度以及隐私...

【专利技术属性】
技术研发人员:李静毅李培董彦成李磊蒋松杨剑曹帅何世枭
申请(专利权)人:中国民用航空总局第二研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1