本公开提供了一种日志脱敏方法、装置、设备及介质,涉及网络安全技术领域。所述方法包括:提取待脱敏日志数据中的敏感信息字段;基于消息摘要算法MD5对敏感信息字段进行处理,得到敏感信息字段的MD5值;基于预设零碰撞哈希算法对所述敏感信息字段进行哈希计算,得到敏感信息字段的哈希值;对MD5值和哈希值进行脱敏处理,得到待脱敏日志数据的脱敏结果。本公开采用MD5算法结合零碰撞哈希算法,有效解决了待脱敏日志数据中敏感信息字段的日志脱敏处理,也达到了脱敏结果零碰撞的要求,既维护了数据安全,又保证了脱敏后数据的唯一性和关联性。关联性。关联性。
【技术实现步骤摘要】
日志脱敏方法、装置、设备及介质
[0001]本公开涉及涉及网络安全
,尤其涉及一种日志脱敏方法、日志脱敏装置、电子设备及计算机可读存储介质。
技术介绍
[0002]数据脱敏是一种重要的数据安全防护手段,数据脱敏是指对某些隐私数据进行处理,如数据的变形,实现隐私数据的可靠保护。
[0003]在相关技术中,常见的数据脱敏方法基本采用信息摘要算法(Message
‑
Digest Algorithm,MD5),或者其他低碰撞高性能的哈希算法。然而,现有日志脱敏方式存在算法单一,部分算法需要非常复杂的计算,大量数据性能开销大、效率低的问题。尤其对于深度报文检测(Deep Packet Inspection,DPI)系统日志的应用中涉及敏感信息通常与用户相关,具有唯一性和关联性,现有数据脱敏方式无法实现零碰撞要求的问题。
[0004]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
[0005]本公开提供一种日志脱敏方法、装置、设备及介质,至少在一定程度上克服相关技术中数据脱敏方式算法单一、无法实现零碰撞要求的技术问题。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]根据本公开的一个方面,提供了一种日志脱敏方法,包括:提取待脱敏日志数据中的敏感信息字段;基于消息摘要算法MD5对敏感信息字段进行处理,得到所述敏感信息字段的MD5值;基于预设零碰撞哈希算法对所述敏感信息字段进行哈希计算,得到所述敏感信息字段的哈希值;对所述MD5值和所述哈希值进行脱敏处理,得到所述待脱敏日志数据的脱敏结果。
[0008]在本公开的一个实施例中,在所述对所述MD5值和所述哈希值进行脱敏处理,得到所述待脱敏日志数据的脱敏结果之后,所述方法还包括:将所述敏感信息字段、所述敏感信息字段的MD5值和所述待脱敏日志数据的脱敏结果存储于历史对应关系表。
[0009]在本公开的一个实施例中,所述方法还包括:周期性遍历所述历史对应关系表,查找是否存在至少两个MD5值相同且敏感信息字段不同的敏感信息字段;若存在至少两个MD5值相同的敏感信息字段,则判断基于预设零碰撞哈希算法对至少两个MD5值相同的敏感信息字段进行哈希计算得到的待验证哈希值是否存在相同,若存在,则基于预设零碰撞哈希算法,重新选择零碰撞哈希算法,以使重新选择的零碰撞哈希算法对至少两个MD5值相同的敏感信息字段的哈希值不相同。
[0010]在本公开的一个实施例中,所述基于预设零碰撞哈希算法,重新选择零碰撞哈希算法,包括:基于预设哈希算法优先级,选择待优化哈希算法以及初始模数因子,其中,所述
待优化哈希算法的优先级高于所述预设零碰撞哈希算法的优先级;基于所述待优化哈希算法和所述初始模数因子,对至少两个MD5值相同的敏感信息字段进行哈希计算,得到至少两个MD5值相同的敏感信息字段的待验证哈希值;若所述至少两个MD5值相同的敏感信息字段的待验证哈希值不同,则将所述待优化哈希算法作为重新选择的零碰撞哈希算法。
[0011]在本公开的一个实施例中,所述方法还包括:若存在至少两个MD5值相同的敏感信息字段的待验证哈希值相同,则调用所述待优化哈希算法对应的模数因子选择函数,计算模数因子;若所述待优化哈希算法的模数因子不满足预设条件,则基于所述待优化哈希算法和所述模数因子,对所述至少两个MD5值相同的敏感信息字段进行哈希计算,直至更新后的至少两个MD5值相同的敏感信息字段的待验证哈希值不同。
[0012]在本公开的一个实施例中,所述方法还包括:若所述待优化哈希算法的模数因子满足所述预设条件,则重新选择哈希算法进行计算,其中,重新选择的哈希算法的优先级比所述待优化哈希算法的优先级高。
[0013]在本公开的一个实施例中,所述方法还包括:若连续多个周期未查询到MD5值相同的敏感信息字段,则基于预设零碰撞哈希算法,重新选择零碰撞哈希算法,重新选择的零碰撞哈希算法的优先级比所述预设零碰撞哈希算法优先级低,以使重新选择的零碰撞哈希算法对所述历史关系对应表中的部分敏感信息字段的哈希值不相同;将重新选择的零碰撞哈希算法更新所述预设零碰撞哈希算法。
[0014]在本公开的一个实施例中,所述预设零碰撞哈希算法包括以下中的至少一项:SDBM哈希算法、RS哈希算法、JS哈希算法、BKDR哈希算法;预设哈希算法优先级由低至高分别为SDBM哈希算法、RS哈希算法、JS哈希算法、BKDR哈希算法。
[0015]在本公开的一个实施例中,所述对所述MD5值和所述哈希值进行脱敏处理,得到所述待脱敏日志数据的脱敏结果,包括:通过连接方式或交替错位方式对所述MD5值和所述哈希值进行混合处理,得到所述待脱敏日志数据的脱敏结果。
[0016]根据本公开的另一个方面,还提供了一种日志脱敏装置,包括:信息提取模块,用于提取待脱敏日志数据中的敏感信息字段;第一计算模块,用于基于消息摘要算法MD5对敏感信息字段进行处理,得到所述敏感信息字段的MD5值;第二计算模块,用于基于预设零碰撞哈希算法对所述敏感信息字段进行哈希计算,得到所述敏感信息字段的哈希值;脱敏处理模块,用于对所述MD5值和所述哈希值进行脱敏处理,得到所述待脱敏日志数据的脱敏结果。
[0017]根据本公开的另一个方面,还提供了一种电子设备,包括处理器以及存储器,存储器用于存储所述处理器的可执行指令,其中,所述处理器配置为经由执行所述可执行指令来执行上述的日志脱敏方法。
[0018]根据本公开的另一个方面,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的日志脱敏方法。
[0019]根据本公开的另一个方面,还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述的日志脱敏方法。
[0020]在本公开的实施方式中,通过提取待脱敏日志数据中的敏感信息字段;基于MD5算
法对敏感信息字段进行处理,得到敏感信息字段的MD5值;基于预设零碰撞哈希算法对敏感信息字段进行哈希计算,得到敏感信息字段的哈希值;对MD5值和哈希值进行脱敏处理,得到待脱敏日志数据的脱敏结果,本公开实施例采用MD5算法结合简单有效的零碰撞哈希算法,有效解决了待脱敏日志数据中敏感信息字段的日志脱敏处理,也达到了脱敏结果零碰撞的要求,既维护了数据安全,又保证了脱敏后数据的唯一性和关联性,保证后续数据关联分析应用的可用性,提升脱敏处理的效率。
[0021]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
[0022]此处的附图被并入说明书中并构成本说明书的一部分,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种日志脱敏方法,其特征在于,包括:提取待脱敏日志数据中的敏感信息字段;基于消息摘要算法MD5对敏感信息字段进行处理,得到所述敏感信息字段的MD5值;基于预设零碰撞哈希算法对所述敏感信息字段进行哈希计算,得到所述敏感信息字段的哈希值;对所述MD5值和所述哈希值进行脱敏处理,得到所述待脱敏日志数据的脱敏结果。2.根据权利要求1所述的方法,其特征在于,在所述对所述MD5值和所述哈希值进行脱敏处理,得到所述待脱敏日志数据的脱敏结果之后,所述方法还包括:将所述敏感信息字段、所述敏感信息字段的MD5值和所述待脱敏日志数据的脱敏结果存储于历史对应关系表。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:周期性遍历所述历史对应关系表,查找是否存在至少两个MD5值相同且敏感信息字段不同的敏感信息字段;若存在,则判断基于预设零碰撞哈希算法对至少两个MD5值相同的敏感信息字段进行哈希计算得到的待验证哈希值是否存在相同,若相同,则从预设算法库中重新选择零碰撞哈希算法,以使重新选择的零碰撞哈希算法对至少两个MD5值相同的敏感信息字段的哈希值不相同;将重新选择的零碰撞哈希算法更新所述预设零碰撞哈希算法。4.根据权利要求3所述的方法,其特征在于,所述基于预设零碰撞哈希算法,重新选择零碰撞哈希算法,包括:基于预设算法库配置的哈希算法优先级,选择待优化哈希算法以及初始模数因子,其中,所述待优化哈希算法的优先级高于所述预设零碰撞哈希算法的优先级;基于所述待优化哈希算法和所述初始模数因子,对至少两个MD5值相同的敏感信息字段进行哈希计算,得到至少两个MD5值相同的敏感信息字段的待验证哈希值;若所述至少两个MD5值相同的敏感信息字段的待验证哈希值不同,则将所述待优化哈希算法作为重新选择的零碰撞哈希算法。5.根据权利要求4所述的方法,其特征在于,所述方法还...
【专利技术属性】
技术研发人员:车力军,杨蕊,聂昆,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。