基于深度学习的日志脱敏方法及系统技术方案

技术编号：39147501 阅读：34 留言：0更新日期：2023-10-23 14:57

本发明专利技术提供了一种基于深度学习的日志脱敏方法及系统，包括以下步骤：对日志数据进行预处理：将日志数据进行格式化处理；对日志数据进行特征提取，得到表示该日志数据的向量；对步骤S2得到的向量进行脱敏处理；对步骤S3得到的脱敏后的向量进行反向转换，转换回原始的日志数据格式。本发明专利技术有益效果：基于深度学习模型的特征提取方法可以充分利用日志数据的多样性和复杂性，提高了脱敏效果和可靠性。自适应学习和更新的特征提取模型可以适应不同的日志数据，具有更好的通用性和扩展性。具有更好的通用性和扩展性。具有更好的通用性和扩展性。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度学习的日志脱敏方法及系统

[0001]本专利技术属于数据安全与隐私保护领域，尤其是涉及一种基于深度学习的日志脱敏方法及系统。

技术介绍

[0002]在任何行业系统中，日志数据都是非常重要的资源，它记录了各种系统和应用的运行情况，是进行故障排查和性能优化的重要依据。但是，由于日志中可能包含敏感信息(如IP地址、用户名、密码、电话号码、身份证号码等)，一旦泄露，就会对个人隐私造成不可估量的损失，甚至会导致企业的声誉受损。
[0003]因此，对日志进行脱敏处理已经成为了必要的安全措施。传统的脱敏方法包括基于规则的方法、基于统计的方法和基于加密的方法等，但是这些方法都存在一定的局限性，不能很好地应对日志数据的多样性和复杂性。

技术实现思路

[0004]有鉴于此，本专利技术旨在提出一种基于深度学习的日志脱敏方法及系统，以解决现有技术中存在的至少一个问题。
[0005]为达到上述目的，本专利技术的技术方案是这样实现的：
[0006]一种基于深度学习的日志脱敏方法，包括以下步骤：
[0007]S1、对日志数据进行预处理：将日志数据进行格式化处理；
[0008]S2、对日志数据进行特征提取，得到表示该日志数据的向量；
[0009]S3、对步骤S2得到的向量进行脱敏处理，使得敏感信息被模糊化，不影响日志数据的可用性；
[0010]S4、对步骤S3得到的脱敏后的向量进行反向转换，转换回原始的日志数据格式。
[0011]进一步的，在步骤S1中，对日志数...

【技术保护点】

【技术特征摘要】
1.基于深度学习的日志脱敏方法，其特征在于：包括以下步骤：S1、对日志数据进行预处理：将日志数据进行格式化处理；S2、对日志数据进行特征提取，得到表示该日志数据的向量；S3、对步骤S2得到的向量进行脱敏处理，使得敏感信息被模糊化，不影响日志数据的可用性；S4、对步骤S3得到的脱敏后的向量进行反向转换，转换回原始的日志数据格式。2.根据权利要求1所述的基于深度学习的日志脱敏方法，其特征在于：在步骤S1中，对日志数据进行预处理：将日志数据进行格式化处理，包括以下内容：去除多余空格和换行符，去除重复信息，去除系统环境变量和配置信息，将日志数据按照字段进行拆分；预处理时还需要替换敏感字段。3.根据权利要求1所述的基于深度学习的日志脱敏方法，其特征在于：所述日志数据的字段包括时间戳、事件类型、IP地址、端口号、用户名、密码、文件名。4.根据权利要求3所述的基于深度学习的日志脱敏方法，其特征在于：在步骤S2中，对日志数据进行特征提取，得到表示该日志数据的向量，包括以下内容：采用卷积神经网络、长短时记忆网络，通过深度学习模型，使步骤S1的日志数据得到日志数据向量。5.根据权利要求3所述的基于深度学习的日志脱敏方法，其特征在于：在步骤S3中，对步骤S2得到的向量进行脱敏处理，使得敏感信息被模糊化，不影响日志数据的可用性，包括以下内容：脱敏...

【专利技术属性】
技术研发人员：何颖，
申请(专利权)人：紫光云技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人