一种基于电网环境的全日志清洗和储存方法技术

技术编号：37710980 阅读：11 留言：0更新日期：2023-06-02 00:03

本申请提供一种基于电网环境的全日志清洗和储存方法，包括以下具体步骤：通过Kafka接收网络安全设备发送的日志数据；基于二次查询的快速日志匹配方法进行重复数据清洗；使用盖帽法对孤点数据进行处理，消除噪声；对缺失的数据设置为序列平均值；对不同设备类型、不同厂商的日志格式做归一化处理，归一化后，多源、异构的日志类型转换成统一的格式存储；对具有相同特征的公共数据部分提取出模板，进行单独存储；基于hadoop大数据平台，对海量日志数据做分布式存储，方便后续分布式计算和分析。本申请采用二次匹配方式，极大的提高效率，实现多源、异构的日志统一存储。方便后续对数据进行进一步分析，对日志进行泛化存储，节约存储资源。资源。资源。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于电网环境的全日志清洗和储存方法

[0001]本申请涉及电网数据处理领域，尤其涉及一种基于电网环境的全日志清洗和储存方法。

技术介绍

[0002]当前，现代电力系统的日常可靠运行，都完全依赖于高度信息化的网络通信与安全防护。如果电力网络或者相关管理信息系统遭到破坏，就会导致电力系统不能正常运行甚至导致瘫痪。近年来，入侵检测系统、防火墙、防病毒软件、网络隔离、加解密软硬件、访问控制和VPN等网络安全技术或产品在电力行业得到了广泛应用，大大增强了电力企业抵御外部攻击的能力。传统的电力系统依靠不同的安全设备进行防御,这些设备根据网络攻击检测情况,每天会产生大量的攻击日志和流量信息。这些信息分散于各个安全设备节点，形成互不关联的数据孤岛，不能为数据安全以及业务带来任何的价值。
[0003]因此，利用网络安全流量与日志信息进行系统安全分析在国内外研究中越来越普遍和受到重视。通过对信息通信系统中不同设备的日志进行采集和统一管理,实现对信息通信系统的威胁检测和安全预警。通过分析主要IT基础设施的网络、系统、应用服务所产生的安全与数据事件之间的关系,增强安全智能。
[0004]电网数据典型的特征为多源、异构。数据分布在不同的网络位置、不同的设备。各设备产生的日志格式因厂商不同、产品形态不同，日志格式多样。如何将多样化的数据进行统一清洗和存储，成为数据安全风险建模、数据风险态势感知的前提条件，也是数据安全风险建模和态势感知的主要技术挑战。
[0005]电网日志存在数据多源、异构的特征，要对电网的全量日志数...

【技术保护点】

【技术特征摘要】
1.一种基于电网环境的全日志清洗和储存方法，其特征在于，包括以下具体步骤：通过Kafka接收网络安全设备发送的日志数据；基于二次查询的快速日志匹配方法进行重复数据清洗；使用盖帽法对孤点数据进行处理，消除噪声；对缺失的数据设置为序列平均值；对不同设备类型、不同厂商的日志格式做归一化处理，归一化后，多源、异构的日志类型转换成统一的格式存储；对具有相同特征的公共数据部分提取出模板，进行单独存储；基于hadoop大数据平台，对海量日志数据做分布式存储，方便后续分布式计算和分析。2.根据权利要求1所述的一种基于电网环境的全日志清洗和储存方法，其特征在于，所述基于二次查询的快速日志匹配方法进行重复数据清洗具体为：a)根据日志来源IP、来源端口、目标IP、目标端口组合生成唯一hash值做为一个Key，key＝hash(src_ip,src_port,dst_ip,dst_port)；b)在四元组hash链表中进行i.如果has...

【专利技术属性】
技术研发人员：王捷，周亮，李晶，黄杰，朱国威，代荡，喻潇，王晋，刘畅，田里，刘畅，徐江珮，龙凤，杜诗雨，徐成伟，苏昊扬，赵环，
申请(专利权)人：国网湖北省电力有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人