基于MapReduce并行AP聚类的网络入侵检测方法技术

技术编号：11071067 阅读：107 留言：0更新日期：2015-02-25 10:42

一种基于MapReduce并行AP聚类的网络入侵检测方法，所述检测方法包括如下步骤：第一步，入侵检测样本数据预处理，完成特征数据的数值化和归一化；第二步，利用基于MapReduce的并行AP聚类压缩入侵检测样本数；第三步，利用压缩后的数据样本，通过KNN或SVM分类器实现高效检测。本发明专利技术提供一种基于MapReduce并行AP聚类的网络入侵检测方法，对数据样本处理具备良好的扩展性，可实现对海量数据样本的有效压缩，提高检测速度和检测精度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及网络安全
，尤其是一种网络入侵检测方法。
技术介绍
网络流量的急剧膨胀，海量数据处理和计算已是入侵检测的常见问题，许多传统的入侵检测方法往往只适用于小规模数据的处理，当数据量增大时，它们往往因计算量的增大而速度减慢甚至无法运行。
技术实现思路
为了克服已有网络入侵检测方法在数据量增大时检测速度较慢、检测精度较低的不足，本专利技术提供一种在海量数据时提高检测速度、检测精度较高的基于MapReduce并行AP聚类的网络入侵检测方法。本专利技术解决其技术问题所采用的技术方案是：一种基于MapReduce并行AP聚类的网络入侵检测方法，所述检测方法包括如下步骤：第一步，入侵检测样本的常规预处理，即完成特征数据的数值化和归一化处理；第二步，利用基于MapReduce的并行AP聚类压缩入侵检测样本数，过程如下：(2.1)相似度矩阵计算的MapReduce并行化AP聚类采用欧式距离的负值来衡量数据点间的相似度，欧式距离的计算公式：s(x,y)=Σk=1nxk2+Σk=1nyk2-2Σk=1nxkyk]]>并行化计算的输入可以看成是每行保存一个数据点的矩阵A，公式的前两项和第三项可以分开算，前两项计算时每个节点不依赖其它节点上的数据，每个节点都可以单独计算存储在自身节点上数据点的各个维度的平方和，而第三项实际就是输入矩阵A与其转置矩阵AT相乘得到的矩阵T...

【技术保护点】
一种基于MapReduce并行AP聚类的网络入侵检测方法，其特征在于：所述检测方法包括如下步骤：第一步，入侵检测样本的预处理，即完成特征数据的数值化和归一化处理；第二步，利用基于MapReduce的并行AP聚类压缩入侵检测样本数，过程如下：(2.1)相似度矩阵计算的MapReduce并行化AP聚类采用欧式距离的负值来衡量数据点间的相似度，欧式距离的计算公式：s(x,y)=Σk=1nxk2+Σk=1nyk2-2Σk=1nxkyk]]>并行化计算的输入可以看成是每行保存一个数据点的矩阵A，公式的前两项和第三项可以分开算，前两项计算时每个节点不依赖其它节点上的数据，每个节点都可以单独计算存储在自身节点上数据点的各个维度的平方和，而第三项实际就是输入矩阵A与其转置矩阵AT相乘得到的矩阵T的第i行第j列的值，假设x是第i个点，而y是第j个点，因此第三项的计算采用类似于并行化计算矩阵相乘的方法；第三项的计算过程如下：Aa11,a12a21,a22-->ATa11,a21a12,a22-->1a11×a11a11×a2120a21&time...

【技术特征摘要】
1.一种基于MapReduce并行AP聚类的网络入侵检测方法，其特征在于：所述
检测方法包括如下步骤：
第一步，入侵检测样本的预处理，即完成特征数据的数值化和归一化处理；
第二步，利用基于MapReduce的并行AP聚类压缩入侵检测样本数，过程如下：
(2.1)相似度矩阵计算的MapReduce并行化
AP聚类采用欧式距离的负值来衡量数据点间的相似度，欧式距离的计算公式：
s(x,y)=Σk=1nxk2+Σk=1nyk2-2Σk=1nxkyk]]>并行化计算的输入可以看成是每行保存一个数据点的矩阵A，公式的前两项和
第三项可以分开算，前两项计算时每个节点不依赖其它节点上的数据，每个节点
都可以单独计算存储在自身节点上数据点的各个维度的平方和，而第三项实际就
是输入矩阵A与其转置矩阵AT相乘得到的矩阵T的第i行第j列的值，假设x
是第i个点，而y是第j个点，因此第三项的计算采用类似于并行化计算矩阵相
乘的方法；
第三项的计算过程如下：
Aa11,a12a21,a22ATa11,a21a12,a221a11×a11a11×a2120a21×a211a12×a12a12×a2220a22×a221a11×a11+a12×a12a11×a21+a12×a2220a21×a21+a22&time...

【专利技术属性】
技术研发人员：陈铁明，张旭，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人