System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及信息安全,尤其涉及一种数据发布方法、数据接收方法、设备及存储介质。
技术介绍
1、随着人工智能(artificial intelligence,ai)和大数据的发展,各种基于数据的应用日益广泛,使得数据成为数字经济中的重要生产要素。然而,与之而来的是日益突出的数据安全风险,比如:由于服务器、存储设备等网络设备在运营过程中会涉及到数据的收集与处理,在数据处理过程中,如果系统关键数据被泄露,会给系统带来安全风险,甚至危害社会公共利益。此外,涉及到用户个人的数据,例如银行账号、口令、身份证号、家庭住址等个人隐私信息也属于重要数据,一旦泄露、非法提供或滥用可能会危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧视性待遇等。因此有必要对系统关键数据、个人隐私信息等重要数据采取保护措施。
2、目前,为了保证系统关键数据、个人隐私信息等重要数据不发生泄露或不被外界知悉,通常采用数据脱敏技术对重要数据进行保护。例如:①采用数据加密的方法进行数据隐私保护,该方法属于低层次的脱敏,加密后的数据会失去业务属性,并且开销较大,需要对密钥进行保管;②使用随机干扰、噪声抑制等方法进行数据隐私保护,该方法属于不可逆的技术,使得数据失真,不能对数据进行再加工、再处理。
技术实现思路
1、本专利技术提供一种数据发布方法、数据接收方法、设备及存储介质,用以实现保持数据的业务属性,同时不增加额外开销;且不会导致数据失真,能够对数据进行再加工、再处理的目的。
2、第一方面,本
3、基于标注矩阵,对结构化的原始数据集中的各重要字段进行标注,并对已标注的各重要字段进行去标识操作,得到去标识数据集;所述标注矩阵用于表征所述原始数据集中的各字段是否重要和各字段的去标识方案;
4、将所述去标识数据集进行公开发布;
5、将所述标注矩阵存储至非易失存储空间,并设置所述非易失存储空间的访问控制权限。
6、根据本专利技术提供的一种数据发布方法,所述原始数据集采用矩阵表示,矩阵的每个元素表示一个字段;
7、所述标注矩阵中的每个元素包括对应字段的重要性标识、去标识化的起始位置和去标识化的字符长度,所述去标识化的字符长度小于或等于对应字段长度;
8、所述基于标注矩阵,对所述原始数据集中的各重要字段进行标注,并对已标注的各重要字段进行去标识操作,得到去标识数据集,包括:
9、针对所述原始数据集中的每个字段,基于所述标注矩阵中所述字段的所述重要性标识确定所述字段是否为重要字段;
10、在所述字段为重要字段的情况下,对所述字段进行标注;
11、对已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行去标识操作,最终得到所述去标识数据集。
12、根据本专利技术提供的一种数据发布方法,所述对已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行去标识操作,包括:
13、将已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串隐匿为相同字符长度的星号字符串或空格字符串;
14、所述方法还包括:
15、基于所述去标识数据集中被隐匿的字符串,构造恢复矩阵;
16、将所述恢复矩阵存储至所述非易失存储空间。
17、根据本专利技术提供的一种数据发布方法,所述标注矩阵中的每个元素还包括所述去标识化的字符长度的随机字符串;
18、所述对已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行去标识操作,包括:
19、将已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串与对应的所述随机字符串按位进行逻辑相加操作。
20、根据本专利技术提供的一种数据发布方法,所述随机字符串是采用噪声信号采集器生成的;所述噪声信号采集器包括:第一电阻、运算放大器、第二电阻、模数转换器、并行-串行转换器和控制器;所述第一电阻的第一端作为模拟电压信号的输入端,所述运算放大器的正向输入端接地,所述第一电阻的第二端与所述运算放大器的负向输入端连接,所述运算放大器的输出端与所述第二电阻的第一端连接,所述第二电阻的第二端与所述模数转换器的输入端连接,所述模数转换器的输出端与所述并行-串行转换器的输入端连接,所述控制器分别与所述模数转换器和并行-串行转换器的控制端连接,所述并行-串行转换器的输出端作为所述随机字符串的输出端。
21、根据本专利技术提供的一种数据发布方法,所述标注矩阵中的每个元素还包括循环移位的字符数和所述去标识化的字符长度的扰动值;
22、所述对已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行去标识操作,包括:
23、将已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串循环移动所述循环移位的字符数;
24、将循环移位后的字符串与对应的所述去标识化的字符长度的扰动值按位进行逻辑相加操作。
25、根据本专利技术提供的一种数据发布方法,通过以下步骤生成所述去标识化的字符长度的扰动值:
26、将已标注的重要字段所在列的所有字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行累加求和再取平均值,得到所述去标识化的字符长度的扰动值。
27、第二方面,本专利技术还提供一种数据接收方法,包括:
28、接收去标识数据集;
29、获取非易失存储空间的访问控制权限,并从所述非易失存储空间中读取标注矩阵;所述标注矩阵用于表征原始数据集中的各字段是否重要和各字段的去标识方案;
30、基于所述标注矩阵,恢复所述去标识数据集中的各重要字段的去标识化的字符,得到所述原始数据集。
31、根据本专利技术提供的一种数据接收方法,所述去标识数据集采用矩阵表示,矩阵的每个元素表示一个字段;
32、所述标注矩阵中的每个元素包括对应字段的重要性标识、去标识化的起始位置和去标识化的字符长度,所述去标识化的字符长度小于或等于对应字段长度;
33、所述基于所述标注矩阵,恢复所述去标识数据集中的各重要字段的去标识化的字符,得到所述原始数据集,包括:
34、针对所述去标识数据集中的每个字段,基于所述标注矩阵中所述字段的所述重要性标识确定所述字段是否为重要字段;
35、在所述字段为重要字段的情况下,对所述重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行恢复操作,最终得到所述原始数据集。
36、根据本专利技术提供的一种数据接收方法,所述方法还包括:
37、从所述非易失存储空间中读取恢复矩阵;所述恢复矩阵是基于所述去标识数据集中被隐匿的字符串构本文档来自技高网...
【技术保护点】
1.一种数据发布方法,其特征在于,包括:
2.根据权利要求1所述的数据发布方法,其特征在于,所述原始数据集采用矩阵表示,矩阵的每个元素表示一个字段;
3.根据权利要求2所述的数据发布方法,其特征在于,所述对已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行去标识操作,包括:
4.根据权利要求2所述的数据发布方法,其特征在于,所述标注矩阵中的每个元素还包括所述去标识化的字符长度的随机字符串;
5.根据权利要求4所述的数据发布方法,其特征在于,所述随机字符串是采用噪声信号采集器生成的;所述噪声信号采集器包括:第一电阻、运算放大器、第二电阻、模数转换器、并行-串行转换器和控制器;所述第一电阻的第一端作为模拟电压信号的输入端,所述运算放大器的正向输入端接地,所述第一电阻的第二端与所述运算放大器的负向输入端连接,所述运算放大器的输出端与所述第二电阻的第一端连接,所述第二电阻的第二端与所述模数转换器的输入端连接,所述模数转换器的输出端与所述并行-串行转换器的输入端连接,所述控制器分别与所述模数转换器和并行-
6.根据权利要求2所述的数据发布方法,其特征在于,所述标注矩阵中的每个元素还包括循环移位的字符数和所述去标识化的字符长度的扰动值;
7.根据权利要求6所述的数据发布方法,其特征在于,通过以下步骤生成所述去标识化的字符长度的扰动值:
8.一种数据接收方法,其特征在于,包括:
9.根据权利要求8所述的数据接收方法,其特征在于,所述去标识数据集采用矩阵表示,矩阵的每个元素表示一个字段;
10.根据权利要求9所述的数据接收方法,其特征在于,所述方法还包括:
11.根据权利要求9所述的数据接收方法,其特征在于,所述标注矩阵中的每个元素还包括所述去标识化的字符长度的随机字符串;
12.根据权利要求9所述的数据接收方法,其特征在于,所述标注矩阵中的每个元素还包括循环移位的字符数和所述去标识化的字符长度的扰动值;
13.一种数据发布装置,其特征在于,包括:
14.一种数据接收装置,其特征在于,包括:
15.一种网络通信设备,其特征在于,包括:上位机、插接在所述网络通信设备的控制板卡和用户单元;所述控制板卡包括控制器;所述控制器包括数据缓存区、控制模块、只读存储器和权限寄存器组;所述控制模块分别与所述数据缓存区、所述只读存储器和所述权限寄存器组通信连接;
16.根据权利要求15所述的网络通信设备,其特征在于,所述标注矩阵中的每个元素包括对应字段的重要性标识、去标识化的起始位置和去标识化的字符长度,所述去标识化的字符长度小于或等于对应字段长度;
17.根据权利要求15所述的网络通信设备,其特征在于,所述标注矩阵中的每个元素包括对应字段的重要性标识、去标识化的起始位置、去标识化的字符长度和所述去标识化的字符长度的随机字符串,所述去标识化的字符长度小于或等于对应字段长度;
18.根据权利要求17所述的网络通信设备,其特征在于,所述随机数生成器为噪声信号采集器;所述噪声信号采集器包括:第一电阻、运算放大器、第二电阻、模数转换器、并行-串行转换器和控制器;所述第一电阻的第一端作为模拟电压信号的输入端,所述运算放大器的正向输入端接地,所述第一电阻的第二端与所述运算放大器的负向输入端连接,所述运算放大器的输出端与所述第二电阻的第一端连接,所述第二电阻的第二端与所述模数转换器的输入端连接,所述模数转换器的输出端与所述并行-串行转换器的输入端连接,所述控制器分别与所述模数转换器和并行-串行转换器的控制端连接,所述并行-串行转换器的输出端作为所述随机字符串的输出端。
19.根据权利要求15所述的网络通信设备,其特征在于,所述标注矩阵中的每个元素包括对应字段的重要性标识、去标识化的起始位置、去标识化的字符长度、循环移位的字符数和所述去标识化的字符长度的扰动值,所述去标识化的字符长度小于或等于对应字段长度;
20.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述的数据发布方法,或实现如权利要求8至12任一项所述的数据接收方法。
21.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的数据发布方法,或实现如权利要求8至12任一项所述的数据...
【技术特征摘要】
1.一种数据发布方法,其特征在于,包括:
2.根据权利要求1所述的数据发布方法,其特征在于,所述原始数据集采用矩阵表示,矩阵的每个元素表示一个字段;
3.根据权利要求2所述的数据发布方法,其特征在于,所述对已标注的重要字段中从所述去标识化的起始位置开始的长度为所述去标识化的字符长度的字符串进行去标识操作,包括:
4.根据权利要求2所述的数据发布方法,其特征在于,所述标注矩阵中的每个元素还包括所述去标识化的字符长度的随机字符串;
5.根据权利要求4所述的数据发布方法,其特征在于,所述随机字符串是采用噪声信号采集器生成的;所述噪声信号采集器包括:第一电阻、运算放大器、第二电阻、模数转换器、并行-串行转换器和控制器;所述第一电阻的第一端作为模拟电压信号的输入端,所述运算放大器的正向输入端接地,所述第一电阻的第二端与所述运算放大器的负向输入端连接,所述运算放大器的输出端与所述第二电阻的第一端连接,所述第二电阻的第二端与所述模数转换器的输入端连接,所述模数转换器的输出端与所述并行-串行转换器的输入端连接,所述控制器分别与所述模数转换器和并行-串行转换器的控制端连接,所述并行-串行转换器的输出端作为所述随机字符串的输出端。
6.根据权利要求2所述的数据发布方法,其特征在于,所述标注矩阵中的每个元素还包括循环移位的字符数和所述去标识化的字符长度的扰动值;
7.根据权利要求6所述的数据发布方法,其特征在于,通过以下步骤生成所述去标识化的字符长度的扰动值:
8.一种数据接收方法,其特征在于,包括:
9.根据权利要求8所述的数据接收方法,其特征在于,所述去标识数据集采用矩阵表示,矩阵的每个元素表示一个字段;
10.根据权利要求9所述的数据接收方法,其特征在于,所述方法还包括:
11.根据权利要求9所述的数据接收方法,其特征在于,所述标注矩阵中的每个元素还包括所述去标识化的字符长度的随机字符串;
12.根据权利要求9所述的数据接收方法,其特征在于,所述标注矩阵中的每个元素还包括循环移位的字符数和所述去标识化的字符长度的扰动值;
13.一种数据发布装置,其特征在于,包括:
14.一种数据接收装置,其特征在于,包括:
15.一种网络通信设备,其特征在于,包括:上位机、插接在所述网络通信设备的控制板卡和用户单元;所述控制板卡...
【专利技术属性】
技术研发人员:苏振宇,刘雁鸣,
申请(专利权)人:苏州元脑智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。