数据处理方法与系统技术方案

技术编号:35355760 阅读:20 留言:0更新日期:2022-10-26 12:32
本申请提供一种数据处理方法与系统,该数据处理方法包括:获取用户数据和操作人员ID;其中,操作人员包括处理去标识后的用户数据的操作人员;对操作人员ID进行去标识处理,以获得盲化盐码;根据盲化盐码与用户ID生成符合预设加密要求的目标字段;以及对目标字段进行加密,以获得去标识后的用户数据。使用本申请实施例提供的数据处理方法在发挥加密算法优势的同时,使用数据的操作人员之间也无法对用户数据进行关联;并且,被加密的用户数据与原始数据之间可以一一对应,将其有序还原。将其有序还原。将其有序还原。

【技术实现步骤摘要】
数据处理方法与系统


[0001]本申请涉及数据加密领域,具体而言,涉及一种数据处理方法。

技术介绍

[0002]在金融机构或其他大型机构中,算法人员经常要进行算法建模,在建模过程中需要对数据进行训练或打标签,而训练或打标签需要样本数据。根据个人信息监管要求,算法人员不可获得用户的个人信息。因此,在此过程中不但要求对样本数据进行加密,也要求算法人员之间是无法相互获取用户数据。
[0003]目前已有的数据加密方法只是对样本数据进行加密,未对使用数据的算法人员等进行限制,从而导致数据泄露;对于银行系统来说,可能引起用户隐私泄露的问题;同时,在数据被加密后无法再进行使用,也导致数据利用率低。

技术实现思路

[0004]鉴于上述问题,本申请实施例的目的在于提供一种数据处理方法与系统,用以对操作人员信息进行盲化后,操作人员的信息被隐藏后;再将用户数据与盲化后的操作人员信息一起进行加密,最终获得加密后的用户数据。在加密的过程中使用的是对称加密算法;从而使被加密的用户数据与原始数据之间可以一一对应,将其有序还原。使用本申请提供的数据处理方法可以在发挥加密算法优势的同时,使用数据的操作人员之间也无法对用户数据进行关联;提高用户数据的保密性,避免了用户隐私泄露等问题。
[0005]第一方面,本申请实施例提供一种数据处理方法,该数据处理方法包括:获取用户数据和操作人员ID;其中,操作人员包括处理去标识后的用户数据的操作人员;对操作人员ID进行去标识处理,以获得盲化盐码;根据盲化盐码与用户数据生成符合预设加密要求的目标字段;以及对目标字段进行加密,以获得去标识后的用户数据。
[0006]在上述实现过程中,获取用户数据和操作人员ID,对操作人员ID进行盲化后,对操作人员ID与用户数据进行加密操作;最后获得处理后的去标识后的用户数据。从而实现了对用户数据的加密,不但普通人员无法破解,而且操作人员之间也无法进行数据关联;同时,在加密过程中使用的算法是对称的加密算法,使被加密的用户数据可以被还原为原始的用户数据,用户数据回到数据仓库时可以进行被逆回原始用户数据,从而能够被再次使用。
[0007]可选地,在本申请实施例中,对操作人员ID进行去标识处理,以获得盲化盐码包括:对操作人员ID进行密码算法,以获得指定格式的备用字段;其中,备用字段为与目标字段格式相同的字段;对备用字段进行XOR操作,以生成盲化盐码;其中,XOR包括按位进行的逻辑异或操作。
[0008]在上述实现过程中,对操作人员ID进行密码算法,从而将其字段变为与加密时需要的目标字段一致的备用字段。对备用字段与原始的操作人员ID进行进一步处理,生成盲化盐码。从而实现对操作人员ID进行区标识化,用安全级别高且效率高的密码算法实现了
对操作人员ID的加密操作,实现了对用户数据的多层保护。使算法人员不可将此信息逆转回个人信息,也不可和其他算法人员的数据关联,也就是说,本申请实施例提供的数据处理方法是不可碰撞,此去标识化ID对于某算法人员是个性化的。
[0009]可选地,在本申请实施例中,对操作人员ID进行密码算法,以获得指定格式的备用字段,包括:在操作人员ID数据末尾进行字节填充,以获得固定长度的数据;根据固定长度的数据获得指定格式的备用字段。
[0010]在上述实现过程中,对操作人员ID数据的长度进行字节填充,进一步处理后,例如迭代压缩得到指定数据个数的备用字段。从而生成与目标字段格式相同的备用字段,以便顺利完成后续的加密操作。
[0011]可选地,在本申请实施例中,根据盲化盐码与用户数据生成符合预设加密要求的目标字段,包括:对盲化盐码与用户数据进行字节填充,以获得字节序列相同的盲化盐码与用户数据;根据将字节序列相同的盲化盐码与用户数据生成符合预设加密要求的目标字段。
[0012]在上述实现过程中,将盲化盐码与用户数据进行字节填充,获得符合加密要求的目标字段;保证字节序列相同,保证密钥的生成方式与编码相同,使用相同字符编解码方式等,才可以保证加密双方的互通。
[0013]可选地,在本申请实施例中,对目标字段加密,以获得去标识后的用户数据包括:使用目标密钥对目标字段进行加密,以获得去标识后的用户数据;其中,目标密钥为对称加密算法的密钥。
[0014]在上述实现过程中,使用对称密码算法的密钥对目标字段进行加密操作,生成去标识后的用户数据。对于某一特定算法人员,相同的ID(比如身份证号)去标识化后应映射到同一个结果,即确定性的映射;否则算法人员对于不同的表里的字段都无法进行关联,而无法采样数据进行训练。
[0015]可选地,在本申请实施例中,在获得去标识后的用户数据之后该数据处理方法还包括:将去标识后的用户数据去盐值,以获得无盐值用户数据;对无盐值用户数据进行解密,以获得用户数据。
[0016]在上述实现过程中,方算法人员使用完加密后的用户数据,该用户数据会回到数据仓库。当算法人员训练后的模型,进行批量推理可能会产生结果,此类结果会写回数据仓库;写回时去标识化的字段应该可以在数据仓库被逆回原字段,这样结果才能够被使用;解决了在数据被加密后无法再进行使用,也导致数据利用率低的问题。
[0017]可选地,在本申请实施例中,在根据操作人员ID获得盲化盐码之前,方法还包括:对用户数据进行脱敏。
[0018]在上述实现过程中,首先对用户数据进行脱敏操作,将敏感信息进行第一次处理;从而满足最基本的加密储存合规要求。
[0019]第二方面,本申请实施例提供一种数据处理系统,其特征在于,数据处理系统包括:数据获取模块、盲化模块和去标识模块;数据获取模块,用于获取用户数据和操作人员ID;其中,操作人员包括处理去标识后的用户数据的操作人员;盲化模块,用于对操作人员ID进行去标识处理,以获得盲化盐码;去标识模块,用于根据盲化盐码与用户数据生成符合预设加密要求的目标字段;去标识模块,还用于对目标字段进行加密,以获得去标识后的用
户数据。
[0020]第三方面,本申请实施例提供一种电子设备,所述电子设备包括存储器和处理器,所述存储器中存储有程序指令,所述处理器读取并运行所述程序指令时,执行上述任一实现方式中的步骤。
[0021]第四方面,本申请实施例还提供一种计算机可读存储介质,所述可读取存储介质中存储有计算机程序指令,所述计算机程序指令被一处理器读取并运行时,执行上述任一实现方式中的步骤。
附图说明
[0022]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0023]图1为本申请实施例提供的数据处理流程图;
[0024]图2为本申请实施例提供的获得盲化盐码的流程图;
[0025]图3为本申请实施例提供的数据处理系统模块示意图;<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:获取用户数据和操作人员ID;其中,所述操作人员包括处理去标识后的所述用户数据的操作人员;对所述操作人员ID进行去标识处理,以获得盲化盐码;根据所述盲化盐码与所述用户数据生成符合预设加密要求的目标字段;以及对所述目标字段进行加密,以获得所述去标识后的所述用户数据。2.根据权利要求1所述的方法,其特征在于,所述对所述操作人员ID进行去标识处理,以获得盲化盐码,包括:对所述操作人员ID进行密码算法,以获得指定格式的备用字段;其中,所述备用字段为与所述目标字段格式相同的字段;对所述备用字段进行XOR操作,以生成所述盲化盐码;其中,所述XOR包括按位进行的逻辑异或操作。3.根据权利要求2所述的方法,其特征在于,所述对所述操作人员ID进行密码算法,以获得指定格式的备用字段,包括:在所述操作人员ID数据末尾进行字节填充,以获得固定长度的数据;根据所述固定长度的数据获得指定格式的备用字段。4.根据权利要求1所述的方法,其特征在于,所述根据所述盲化盐码与所述用户数据生成符合预设加密要求的目标字段,包括:对所述盲化盐码与所述用户数据进行字节填充,以获得字节序列相同的所述盲化盐码与所述用户数据;根据将所述字节序列相同的所述盲化盐码与所述用户数据生成所述符合预设加密要求的目标字段。5.根据权利要求1所述的方法,其特征在于,所述对所述目标字段加密,以获得所述去标识后的所述用户数据,包括:使用目标密钥对所述目标字...

【专利技术属性】
技术研发人员:周辉
申请(专利权)人:平安银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1