【技术实现步骤摘要】
数据处理方法、装置、设备以及存储介质
[0001]本公开涉及人工智能领域,尤其涉及自动驾驶、智能交通等
技术介绍
[0002]目前,在各种业务系统运行过程中,系统的日志数据以及数据库数据中通常会涉及到大量的敏感数据,如车辆交通业务系统中,可能包括车主和乘客的相关敏感数据,需要对这些数据进行保护,避免发生泄漏。
技术实现思路
[0003]本公开提供了一种数据处理方法、装置、设备以及存储介质。
[0004]根据本公开的一方面,提供了一种数据处理方法,包括:
[0005]对目标业务系统的原始日志数据进行用户实体转化处理,得到实体数据和非实体数据;
[0006]利用预设字段脱敏规则,对所述实体数据中对应的预设敏感字段进行脱敏处理;
[0007]对所述非实体数据进行分词处理,利用预设分类模型确定所得到的分词对应的类别标签,其中,所述类别标签包括非敏感标签和多种不同的敏感标签;
[0008]针对对应所述敏感标签的目标分词,采用所述敏感标签对应的预设分词脱敏规则进行脱敏处理,其中,不同所述敏感标签对应的所述预设分词脱敏规则不同。
[0009]根据本公开的另一方面,提供了一种数据处理装置,包括:
[0010]实体转化模块,用于对目标业务系统的原始日志数据进行用户实体转化处理,得到实体数据和非实体数据;
[0011]第一脱敏模块,用于利用预设字段脱敏规则,对所述实体数据中对应的预设敏感字段进行脱敏处理;
[0012]分词处理模块,用于对所 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:对目标业务系统的原始日志数据进行用户实体转化处理,得到实体数据和非实体数据;利用预设字段脱敏规则,对所述实体数据中对应的预设敏感字段进行脱敏处理;对所述非实体数据进行分词处理,利用预设分类模型确定所得到的分词对应的类别标签,其中,所述类别标签包括非敏感标签和多种不同的敏感标签;针对对应所述敏感标签的目标分词,采用所述敏感标签对应的预设分词脱敏规则进行脱敏处理,其中,不同所述敏感标签对应的所述预设分词脱敏规则不同。2.根据权利要求1所述的方法,其中,所述敏感标签包括敏感关键字标签,所述敏感关键字标签对应的预设分词脱敏规则中包括第一字符数量和第二字符数量;其中,所述针对对应所述敏感标签的目标分词,采用所述敏感标签对应的预设分词脱敏规则进行脱敏处理,包括:针对对应所述敏感关键字标签的第一目标分词,获取所述敏感关键字标签对应的预设分词脱敏规则中的所述第一字符数量和所述第二字符数量;将所述非实体数据中,所述第一目标分词的前第一字符数量的字符、所述第一目标分词、以及所述第一目标分词的后第二字符数量的字符替换为预设脱敏字符。3.根据权利要求1所述的方法,其中,所述实体数据的数据结构包括类中类结构,所述类中类结构中包括父实体类和子实体类,所述原始日志数据中包括所述父实体类对应的用户与所述子实体类对应的用户的关联关系信息;其中,所述利用预设字段脱敏规则,对所述实体数据中对应的预设敏感字段进行脱敏处理,包括:遍历所述实体数据中的所述父实体类和所述子实体类,将携带有预设脱敏注解的所述预设字段确定为预设敏感字段,利用所述预设脱敏注解关联的预设字段脱敏规则,对所述预设敏感字段进行脱敏处理。4.根据权利要求1所述的方法,还包括:响应于所述目标业务系统的目标数据库中目标明文字段的加密事件被触发,在所述目标数据库中创建目标密文字段,其中,所述目标密文字段用于存储采用预设加密规则对所述目标明文字段中的明文数据进行加密后得到的密文数据;获取请求端发送的针对所述目标数据库的包含所述目标明文字段的原始请求;根据所述原始请求的请求类型对所述原始请求进行改写,得到目标请求;向所述目标数据库发送所述目标请求。5.根据权利要求4所述的方法,其中,所述根据所述原始请求的请求类型对所述原始请求进行改写,得到目标请求,包括:在所述原始请求的请求类型为写入请求的情况下,根据所述原始请求确定第一目标请求,将所述原始请求中的所述目标明文字段替换为所述目标密文字段,得到第二目标请求,其中,所述目标请求中包括所述第一目标请求和所述第二目标请求,所述写入请求包括插入请求和/或更新请求。6.根据权利要求4所述的方法,其中,所述根据所述原始请求的请求类型对所述原始请求进行改写,得到目标请求,包括:
在所述原始请求的请求类型为查询请求的情况下,将所述原始请求中的所述目标明文字段替换为所述目标密文字段,采用所述预设加密规则对所述原始请求中的所述目标明文字段对应的明文数据进行加密,得到目标查询请求;其中,所述方法还包括:接收所述目标数据库针对所述目标查询请求返回的响应数据;对所述响应数据中包含的密文数据进行解密,并向所述请求端返回解密后的响应数据。7.根据权利要求6所述的方法,在所述接收所述目标数据库针对所述目标查询请求返回的响应数据之后,还包括:通过网关层对所述响应数据进行校验,其中,所述校验包括数据类型的校验和所述请求端的用户权限的校验,数据类型包括明文类型和密文类型。8.根据权利要求7所述的方法,还包括:在所述解密数据中包含资源地址的情况下,将所述原始请求中包含的令牌信息和/或允许访问时段信息添加至所述资源地址中,得到修改后的解密数据,其中,所述允许访问时段信息与所述用户权限相关;其中,向所述请求端返回解密数据,包括:向所述请求端返回所述修改后的解密数据。9.一种数据处理装置,包括:实体转化模块,用于对目标业务系统的原始日志数据进行用户实体转化处理,得到实体数据和非实体数据;第一脱敏模块,用于利用预设字段脱敏规则,对所述实体数据中对应的预设敏感字段进行脱敏处理;分词处理模块,用于对所述非实体数据进行分词处理;类别标签确定模块,用于利用预设分类模型确定所得到...
【专利技术属性】
技术研发人员:陈君豪,李志亮,任龙,
申请(专利权)人:阿波罗智行科技广州有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。