一种基于无监督学习的无线传感器异常数据检测方法技术

技术编号:21225432 阅读:20 留言:0更新日期:2019-05-29 06:10
本发明专利技术公开了一种基于无监督学习的无线传感器异常数据检测方法,包括步骤:1、获取无线传感器节点连续采集的m个数据构成训练样本集;2、建立四分之一超球支持向量机模型,其球心位于高维空间坐标原点,最小支持半径为R;3、应用粒子群算法和训练样本集对四分之一超球支持向量机模型的参数进行优化,得到优化模型;4、获取无线传感器节点连续采集的m+1个数据Tq,计算Tm+1在优化模型的映射空间中到球心的距离d(Tm+1),如果d(Tm+1)≤R,Tm+1为正常数据;如果d(Tm+1)>R,用{T1,T2,..Tm}作为训练样本集重新训练模型并计算最小支持半径Rnew,计算Tm+1在更新后模型的映射空间中到球心的距离d(Tm+1)new,如果d(Tm+1)new≤Rnew,数据Tm+1为正常数据,否则Tm+1为异常数据。该方法采用无监督学习,无需对样本进行标注,且检测正确率较高。

An unsupervised learning-based anomaly detection method for wireless sensor data

The invention discloses a wireless sensor anomaly data detection method based on unsupervised learning, which includes steps: 1. acquiring M data continuously collected by wireless sensor nodes to form a training sample set; 2. establishing a quadrant hypersphere support vector machine model whose spherical center is located at the origin of high-dimensional space coordinates and the minimum support radius is R; 3. applying particle swarm optimization algorithm and training sample set. The parameters of the quarter-hypersphere support vector machine model are optimized to obtain the optimal model; 4. Obtain m+1 data Tq continuously collected by wireless sensor nodes and calculate the distance D (Tm+1) from Tm+1 to the sphere center in the mapping space of the optimal model. If D (Tm+1) = R, Tm+1 is a constant data; if D (Tm+1) > R, use {T1, T2,... Tm} as the training sample set to retrain the model and calculate the most. The distance D (Tm+1) new from Tm+1 to the center of the sphere in the mapping space of the updated model is calculated. If D (Tm+1) new is less than Rnew, the data Tm+1 is constant, otherwise Tm+1 is abnormal. This method uses unsupervised learning, does not need to label the samples, and has a high detection accuracy.

【技术实现步骤摘要】
一种基于无监督学习的无线传感器异常数据检测方法
本专利技术属于无线传感器安全领域,具体涉及一种基于无监督学习的无线传感器异常数据检测方法。
技术介绍
无线传感器网络近年来越来越多地受到全世界的广泛关注,已经成为一个极为重要的研究领域,它在融合通信和传感领域的同时,已实现的成果也为其他领域的研究打下了基础。无线传感器网络具有广泛的使用场景,如环境监测应用、军事侦察、医疗设备、智能农业、炼油工业等。无线传感器网络通常是由在大范围内密集部署的多个传感器组成,这些外观小巧的传感器用于监视并收集周围的环境信息,同时通过无线电通信将这些信息发送至汇聚节点。由于这些传感器设备成本低,使得它们通常具有存储器空间小、计算能力低、电池容量小、使用寿命短和能量带宽有限的特点,容易使收集到的数据与一般情况下的正常数据有偏差。此外,无线传感器的部署地点常常处于空旷、人烟稀少的野外地区,增加了遭受自然灾难侵袭的可能性,导致硬件和软件的故障,这也提高了异常数据的产生率,所以务必要对无线传感器节点进行异常数据检测,这可以提升网络中采集的数据质量,进行安全监控,并发现重要事件。针对无线传感器节点的异常检测问题,国内外许多研究人员早已提出了各种应对方法,如文献Outlierdetectioninsensornetworks中提出的一种基于直方图的统计学方法,收集节点数据分布的直方图信息来进行正常和异常数据的筛选,但是太多的直方图信息会增加通信开销。另外一些方法使用机器学习中的相关算法进行异常检测,如A.T.C.Andrade等人提出的CWA(Outlierdetectionusingk-meansclusteringandlightweightmethodsforWirelessSensorNetworks)方法,使用聚类方法对节点进行分簇来识别出异常值。支持向量机是一种基于分类的机器学习方法,具有单分类、二分类和多分类三种形式。在二分类和多分类方法中,需要使用带标签的训练样本,而在无线传感器节点的异常数据检测中无法事先对采集的数据进行判别,所以单分类支持向量机作为一种无监督技术,更适合用在这样的场景中。与将超平面或超球作为映射空间的单分类方法相比,四分之一超球方法不使用非线性方法解决计算问题,算法更容易实现。相关方法也已提出很多,如S.Rajasegarar等提出的BOD(QuarterSphereBasedDistributedAnomalyDetectioninWirelessSensorNetworks)方法,YangZhang等提出的AOD(Ensuringhighsensordataqualitythroughuseofonlineoutlierdetectiontechniques)方法,都是在四分之一超球支持向量机的基础上实现,但是这些方法的检测率和误报率仍存在进步的空间。
技术实现思路
专利技术目的:本专利技术旨在提供一种可以在线实时检测无线传感器节点采集数据是否异常的方法,该方法采用无监督学习,无需对样本进行标注,且检测正确率较高。技术方案:本专利技术采用如下技术方案:一种基于无监督学习的无线传感器异常数据检测方法,包括步骤:(1)获取无线传感器节点连续采集的m个数据,构成训练样本集S,S={si|i=1..m},si为D维向量;(2)建立四分之一超球支持向量机模型,所述四分之一超球支持向量机模型的球心位于高维空间坐标原点,最小支持半径为R,其所要求解的约束问题为:s.t.||φ(x)||2≤R2+ξiξi≥0其中R属于实数集ξ={ξi|i=1..m}为松弛变量,ξ属于m维实数向量集其每一个元素ξi均为实数;u为惩罚参数,φ(x)为原始数据空间到高维空间的映射函数。其对偶形式为:其中a={ai|i=1..m}为拉格朗日乘子,a属于m维实数向量集k(xi,xi)为核函数,k(xi,xi)=φ(xi)·φ(xi)=||φ(xi)||2,φ(xi)·φ(xi)是φ(xi)的内积,k(x,z)=exp(-||x-z||2/2σ2);(3)应用粒子群算法和训练样本集对参数u和σ进行优化,得到优化后的四分之一超球支持向量机模型;计算出模型的最小支持半径R;(4)获取无线传感器节点连续采集的m+1个数据Tq,q=1..m+1,数据Tm+1是否异常的检测步骤为:计算数据Tm+1在优化后的四分之一超球支持向量机模型的映射空间中到球心的距离d(Tm+1),如果d(Tm+1)≤R,数据Tm+1为正常数据;如果d(Tm+1)>R,用{T1,T2,..Tm}构成新的训练样本集T,按照步骤2-3重新构建并训练四分之一超球支持向量机模型,得到更新后的最小支持半径Rnew,重新计算数据Tm+1在更新后的四分之一超球支持向量机模型的映射空间中到球心的距离d(Tm+1)new,如果d(Tm+1)new≤Rnew,数据Tm+1为正常数据,否则Tm+1为异常数据。所述步骤(3)包括:(3.1)定义M个粒子组成粒子集Z={zj|j=1..M},每个粒子的位置用p表示,p=(u,σ);随机初始化M个粒子的位置和速度,第j个粒子zj的位置为pj=(uj,σj),速度为vj;定义位置在(u,σ)粒子的适应度为:其中N(u,σ)表示以u和σ的值作为参数的四分之一超球支持向量机模型对训练样本集S中的样本进行异常检测,检测结果正确的数量;初始化迭代次数h=0,初始化第j个粒子的最佳位置pj,best为pj;(3.2)将M个粒子的初始位置pj=(uj,σj)分别作为参数计算适应度,选择其中适应度值最大的粒子位置作为初始的粒子集最佳位置pbest;(3.3)按如下更新方程更新粒子集Z中粒子zj的位置和速度:上式中,上标表示迭代次数;c1、c2为加速度系数;r1、r2为(0,1)范围内均匀分布的伪随机数;位置在(u,σ)粒子的惯性权重ω(u,σ)为:ωmin为惯性权重可取的最小值,ωmax为惯性权重可取的最大值,favg为第h次迭代完成后所有粒子适应度的平均值,fmin为第h次迭代完成后所有粒子适应度的最小值;更新完成后重新计算每个粒子的适应度;如果则将pj,best的值更新为如果则将pbest更新为迭代次数h加一;(3.4)重复步骤(3.3),直到迭代次数h达到预设的阈值Hth,或pbest连续Ht′h次迭代都不发生更新,结束迭代;此时pbest的值(ubest,σbest)即为步骤(2)中建立的四分之一超球支持向量机模型的最优参数;根据(ubest,σbest)的值计算出模型的最小支持半径R,步骤如下:将u=ubest、σ=σbest、训练样本集S代入步骤(2)中建立的四分之一超球支持向量机模型的约束问题的对偶形式中,求解出拉格朗日乘子a={ai|i=1..m},对于符合的序号i,计算其对应的样本si在优化后的四分之一超球支持向量机模型的映射空间中到球心的距离d(si),最小支持半径R的值即为d(si)。步骤(4)中计算待检测数据Tm+1在优化后的四分之一超球支持向量机模型的映射空间中到球心的距离d(Tm+1)为:(4.1)计算训练样本集的核函数矩阵其中1m是所有元素为的m阶方阵;K为m阶方阵,其第i行j列的元素为k(si,sj),si与sj为训练样本集中的样本,i,j=1..本文档来自技高网
...

【技术保护点】
1.一种基于无监督学习的无线传感器异常数据检测方法,其特征在于,包括步骤:(1)获取无线传感器节点连续采集的m个数据,构成训练样本集S,S={si|i=1..m};(2)建立四分之一超球支持向量机模型,所述四分之一超球支持向量机模型的球心位于高维空间坐标原点,最小支持半径为R,其所要求解的约束问题为:

【技术特征摘要】
1.一种基于无监督学习的无线传感器异常数据检测方法,其特征在于,包括步骤:(1)获取无线传感器节点连续采集的m个数据,构成训练样本集S,S={si|i=1..m};(2)建立四分之一超球支持向量机模型,所述四分之一超球支持向量机模型的球心位于高维空间坐标原点,最小支持半径为R,其所要求解的约束问题为:s.t.||φ(x)||2≤R2+ξiξi≥0其中R属于实数集ξ={ξi|i=1..m}为松弛变量,ξ属于m维实数向量集其每一个元素ξi均为实数;u为惩罚参数,φ(x)为原始数据空间到高维空间的映射函数;其对偶形式为:其中a={ai|i=1..m}为拉格朗日乘子,a属于m维实数向量集k(xi,xi)为核函数,k(xi,xi)=φ(xi)·φ(xi)=||φ(xi)||2,φ(xi)·φ(xi)是φ(xi)的内积,采用高斯核函数k(x,z)=exp(-||x-z||2/2σ2);(3)应用粒子群算法和训练样本集对参数u和σ进行优化,得到优化后的四分之一超球支持向量机模型;计算出模型的最小支持半径R;(4)获取无线传感器节点连续采集的m+1个数据Tq,q=1..m+1,数据Tm+1是否异常的检测步骤为:计算数据Tm+1在优化后的四分之一超球支持向量机模型的映射空间中到球心的距离d(Tm+1),如果d(Tm+1)≤R,数据Tm+1为正常数据;如果d(Tm+1)>R,用{T1,T2,..Tm}构成新的训练样本集T,按照步骤2-3重新构建并训练四分之一超球支持向量机模型,得到更新后的最小支持半径Rnew,重新计算数据Tm+1在更新后的四分之一超球支持向量机模型的映射空间中到球心的距离d(Tm+1)new,如果d(Tm+1)new≤Rnew,数据Tm+1为正常数据,否则Tm+1为异常数据。2.根据权利要求1所述的基于无监督学习的无线传感器异常数据检测方法,其特征在于,所述步骤(3)包括:(3.1)定义M个粒子组成粒子集Z={zj|j=1..M},每个粒子的位置用p表示,p=(u,σ);随机初始化M个粒子的位置和速度,第j个粒子zj的位置为pj=(uj,σj),速度为vj;定义位置在(u,σ)粒子的适应度为:其中N(u,σ)表示以u和σ的值作为参数的四分之一超球支持向量机模型对训练样本集S中的样本进行异常检测,检测结果正确的数量;初始化迭代次数h=0,初始化第...

【专利技术属性】
技术研发人员:吴蒙华志颖杨立君
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1