【技术实现步骤摘要】
字段脱敏方式确定方法、装置、电子设备及存储介质
[0001]本申请涉及数据处理
,更具体的说,是涉及一种字段脱敏方式确定方法
、
装置
、
电子设备及存储介质
。
技术介绍
[0002]目前,为了保证用户的隐私安全,通常识别表格中字段是否为敏感字段,并对敏感字段对应的用户数据进行脱敏,再使用脱敏后的数据
。
[0003]但是,由于识别表格中字段是否为敏感字段的方法,在确定表格中的字段是否为敏感字段之后,需要工作人员确定字段的安全等级,并根据安全等级确定脱敏方式,导致字段脱敏效率低
。
技术实现思路
[0004]鉴于上述问题,提出了本申请以便提供一种字段脱敏方式确定方法
、
装置
、
电子设备及存储介质,以实现对表格字段安全等级的识别
。
具体方案如下:
[0005]一种字段脱敏方式确定方法,所述方法包括:
[0006]获得目标字段的名称和所述目标字段的属性数据;
[0007]根据所述目标字段的名称和所述目标字段的属性数据,获得第一数据,所述第一数据表征所述目标字段的敏感程度;
[0008]根据所述第一数据,获得所述目标字段对应的安全等级,所述目标字段的安全等级用于确定所述目标字段的脱敏方式
。
[0009]可选的,所述第一数据为所述目标字段对应的敏感标签,所述目标字段对应的敏感标签表征所述目标字段对应的敏感等级;
[0010]其中 ...
【技术保护点】
【技术特征摘要】
1.
一种字段脱敏方式确定方法,其特征在于,所述方法包括:获得目标字段的名称和所述目标字段的属性数据;根据所述目标字段的名称和所述目标字段的属性数据,获得第一数据,所述第一数据表征所述目标字段的敏感程度;根据所述第一数据,获得所述目标字段对应的安全等级,所述目标字段的安全等级用于确定所述目标字段的脱敏方式
。2.
根据权利要求1所述的方法,其特征在于,所述第一数据为所述目标字段对应的敏感标签,所述目标字段对应的敏感标签表征所述目标字段对应的敏感等级;其中,根据所述目标字段的名称和所述目标字段的属性数据,获得第一数据,包括:获取第一词向量和第二词向量,所述第一词向量为所述目标字段的名称对应的词向量,所述第二词向量为所述目标字段的属性数据对应的词向量;通过敏感等级识别模型,对所述第一词向量和所述第二词向量进行处理,以得到所述目标字段对应的敏感标签;其中,所述敏感等级识别模型是基于第一训练样本进行模型训练得到的,所述第一训练样本包括第一输入样本和第一输出样本,所述第一输入样本为词向量样本,所述第一输出样本为所述词向量样本对应的敏感标签,所述词向量样本基于历史数据得到,所述词向量样本对应的敏感标签表征所述词向量样本对应的字段的敏感等级;其中,根据所述第一数据,获得所述目标字段对应的安全等级,包括:根据所述目标字段的敏感等级,获得所述目标字段对应的安全等级,所述目标字段的敏感等级与所述目标字段对应的安全等级相对应
。3.
根据权利要求1所述的方法,其特征在于,所述第一数据包括多个目标数值,一个所述目标数值对应于一个安全等级,所述目标数值表征所述目标字段属于所述目标数值对应的安全等级的概率;其中,根据所述目标字段的名称和所述目标字段的属性数据,获得第一数据,包括:获取第一词向量和第二词向量,所述第一词向量为所述目标字段的名称对应的词向量,所述第二词向量为所述目标字段的属性数据对应的词向量;通过概率获得模型,对所述第一词向量和所述第二词向量进行处理,以得到所述多个目标数值;其中,所述概率获得模型是基于第二训练样本进行模型训练得到的,所述第二训练样本包括第二输入样本和第二输出样本,所述第二输入样本为词向量样本,所述词向量样本是基于历史数据得到的,所述第二输出样本包含多个历史数值,一个所述历史数值对应一个安全等级,所述历史数值表征所述词向量样本对应的字段属于历史数值对应的安全等级的概率
。4.
根据权利要求2或3所述方法,其特征在于,所述词向量样本通过以下方式获取:获取历史表格中的表格字段的名称和所述表格字段的属性数据;在所述表格字段的名称和所述表格字段的属性数据中,删除无效字段的名称和所述无效字段的属性数据,以得到所述历史字段的名称和所述历史字段的属性数据,所述无效字段属于预设无效字段集合;对所述历史字段的名称和所述历史字段的属性数据进行向量生成处...
【专利技术属性】
技术研发人员:丁锐,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。