本发明专利技术涉及基于支持向量机的半监督学习室内定位方法,该定位方法包括如下步骤:S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自覆盖区域内WiFi无线接入点AP的信号接收强度RSS数据;S2.对所述采集数据进行处理;S3.对移动终端进行定位。本发明专利技术这种支持向量机方法实时定位精度高,采集数据利用效率高,适用场景广。
【技术实现步骤摘要】
基于支持向量机的半监督学习室内定位方法
本专利技术涉及一种应用于室内环境的无线电定位技术,特别是涉及基于支持向量机的半监督学习室内定位方法。
技术介绍
在现今室内定位技术中,有两种应用基于WiFi信号强度定位的常用方法:一是利用信号损耗经验模型,通过求解定位圆方程,获得多个定位圆交点或多条定位直线交点作为位置估计值,由于经验公式误差随着场景不同差距较大,因此该方法的定位误差非常大;二是通过前期在室内环境中进行大量的训练数据采样和数据处理来建立所需的经验数据库,然后利用机器学习的方法确定位置,此方法定位精度较高,但是前期采样数据过程耗时费力,并且采集到的数据样本集不仅数据量大,而且由于无线信道的时变特性,无法实时更新修正数据集的误差,影响定位精度。
技术实现思路
针对以上现有技术的不足,为解决能充分利用所有采集数据并提高性能,本专利技术基于机器学习中的支持向量机方法,提出一种基于支持向量机的半监督学习室内定位方法。基于支持向量机的半监督学习室内定位方法包括如下步骤:S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自覆盖区域内WiFi无线接入点AP的信号接收强度RSS数据;S2.对所述采集数据进行处理;S3.对移动终端进行定位。所述S1网格采集包括连续型采集数据和离散型采集数据。所述连续型采集数据或离散型采集数据,都对应着一组已知接入点AP编号的RSS数据。所述S2对所述采集数据进行处理包括带位置标签的数据处理,不带位置标签的连续型数据处理和不带位置标签的离散型数据的处理。所述带位置标签的数据处理包括两类分类问题的C-支持向量机方法和多分类问题的方法;所述支持向量机方法包括步骤如下:步骤一:任取带不同位置标签的两类数据,使用高斯核函数映射至数据高维空间;步骤二:针对不同级别的数据设置松弛变量和惩罚参数,构造二次优化不等式组;步骤三:求解二次优化不等式组,获得分类超平面,即两类分类器;所述多分类问题方法包括步骤如下:步骤一:将所有数据按照位置标签两两组合;步骤二:将步骤一中的两两组合使用两类分类问题的C-支持向量机方法构造两类分类器,所有两类分类器组合构成多分类分类器;步骤三:将待定位移动终端获取到的数据输入多分类分类器,使用投票法,获得最终定位结果。所述不带位置标签的连续型数据处理包括:1)对处理数据进行等级划分,带位置标签的数据划分在第一层次;大部分无位置标签连续型数据划分在第二层次,所有离散采集的未带位置标签的数据的定位结果,划分在第三层次;2)对第一层次的数据的惩罚因子C1设定一个适当的值;3)将第二层次的数据进行分类,获得的结果再加入至带位置标签的训练数据中,并设置惩罚参数C2,以得到一个新的分类器;4)使用第三层次的数据重复步骤3)的内容,并设置相应的惩罚参数的C3;5)利用所有的训练数据,我们获得了最终的数据分类器。所述的定位包括如下步骤:1)统计每个网格中接收到的AP的RSS值>=-70dBm的数量,并选取数目在前k的网格作为聚类中心。确定好聚类中心后,设中心网格的RSS值向量为μi,待聚类网格的RSS值向量为Rj;2)根据数据预聚类的方法,确定室内环境中聚类中心的位置,然后每一个AP都储存着一个聚类中心表,按照距离AP所在位置的空间距离由近及远排列,当MS需要定位服务时,会发起服务请求,然后接受服务请求的AP用数据预聚类的方法查找聚类中心表,找到最接近的聚类中心,并把聚类中心位置报告至云端服务器;3)在云端服务器中,使用数据处理阶段获得的多分类器对MS的RSS数据进行分类,其中使用多分类器所有类别之间“成对比较”的比较的方式替换为以聚类中心聚集的聚类内部类别之间采用“成对比较”的方式,最后获得最终的定位结果。本专利技术的优点在于:本专利技术这种支持向量机方法实时定位精度高,采集数据利用效率高,适用场景广。附图说明图1:数据处理阶段半监督学习算法的流程框图;图2:无位置标签的连续采集数据分级结果;图3:训练数据分级;图4:室内定位的云计算框架。具体实施方式以下结合附图对本专利技术进行详细说明。本方法基于机器学习中支持向量机的方法进行研究,保证了算法的普遍性。采用了理论分析、可行性论证和计算机仿真结合的方法,从理论和实践方面验证了所提出的方案。包括如下内容。一、无线信号强度分布数据采集阶段:本专利技术首先需要预先将需要室内定位的环境划分为长宽一定的正方形网格,每个网格对应相应的编号,即为位置标签。在每一个网格中采集接收到来自覆盖区域内WiFi无线接入点(AP,AccessPoint)的信号接收强度(RSS)数据,采集过程可以包括以下两种方式:1.连续型采集:通过在室内环境中连续采集获得。采集到的数据中,序号相邻的数据所对应的位置标签是同一或相邻网格,不可能出现位置标签跳跃的情形,称这类数据为连续型数据。2.离散型采集:采集的数据是通过在室内环境中分散随意采集获得的,相邻数据之间没有特定的关系,称这类数据为离散型数据。采集阶段获得的数据格式:无论是连续型数据还是离散型数据,都对应着一组已知接入点(AP)编号的RSS数据,但是却不能保证每一项采集的数据都有已知的位置标签。Must:此选项不能为空,Optional:此选项可以为空。带位置标签的数据集定义为可信训练数据集合,该集合内的数据能够被直接被利用去生成应用于室内定位过程的分类器;不带位置标签的数据集定义为存疑训练数据集合,该集合内的数据需要经过处理才能被利用去生成应用于室内定位过程的分类器。二、采集数据处理阶段:步骤1:带位置标签的数据的处理视每一个位置标签作为一个类别(设总共包含L个类别),利用训练数据进行室内定位就是一个典型的多分类问题,解决多分类问题的方式是将其转换为两类分类问题,两类分类问题的解决方案是多分类问题解决方案的基础,因此在本专利技术的采集数据处理阶段算法分为两个部分:两类分类问题的算法和多分类问题的算法。1)两类分类问题的C-支持向量机(C-SVM)算法也即首先任取带不同位置标签的两类数据,使用高斯核函数映射至数据高维空间;然后针对不同级别的数据设置松弛变量和惩罚参数,构造二次优化不等式组;再求解二次优化不等式组,获得分类超平面,即两类分类器。具体过程如下。设置训练数据为一个l维向量xi:x∈Rd,它的类别为yi,y∈{-1,+1},在线性SVM分类器的情况下,我们可以用(L-1)维超平面去将这些数据划分为两类。在非线性SVM分类器的情况下,为了使我们可以使用线性SVM分类器模型,将使用核函数κ(·,·)=(Φ(·)·Φ(·))把非线性的原始输入数据空间转换至高维特征空间中。在室内环境中的信号传播是近似呈指数衰减,因此我们可选择高斯函数作为核函数。κ(x,x′)=exp(-||x-x′||2/(2σ2))(1)考虑到带噪声的训练数据可能会降低SVM分类器的性能,通过使用松弛变量ξ,允许一些异常值偏离分类平面的边界。为了限制总偏差,设置惩罚参数C与各个松弛变量ξ相乘累加。因此新的C-SVM的二次优化问题,可如下式所示。s.t.yi[(ω·xi)+b]≥1-ξi,i=1,...,L本文档来自技高网...
【技术保护点】
基于支持向量机的半监督学习室内定位方法,其特征在于,该定位方法包括如下步骤:S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自覆盖区域内WiFi无线接入点AP的信号接收强度RSS数据;S2.对所述采集数据进行处理;S3.对移动终端进行定位。
【技术特征摘要】
1.基于支持向量机的半监督学习室内定位方法,其特征在于,该定位方法包括如下步骤:S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自覆盖区域内WiFi无线接入点AP的信号接收强度RSS数据;S2.对所述采集数据进行处理;S3.对移动终端进行定位;所述的定位包括如下步骤:1)统计每个网格中接收到的AP的RSS值>=-70dBm的数量,并选取数目在前k的网格作为聚类中心;确定好聚类中心后,设中心网格的RSS值向量为μi,待聚类网格的RSS值向量为Rj;2)根据数据预聚类的方法,确定室内环境中聚类中心的位置,然后每一个AP都储存着一个聚类中心表,按照距离AP所在位置的空间距离由近及远排列,当MS需要定位服务时,会发起服务请求,然后接受服务请求的AP用数据预聚类的方法查找聚类中心表,找到最接近的聚类中心,并把聚类中心位置报告至云端服务器;3)在云端服务器中,使用数据处理阶段获得的多分类器对MS的RSS数据进行分类,其中使用多分类器所有类别之间“成对比较”的比较的方式替换为以聚类中心聚集的聚类内部类别之间采用“成对比较”的方式,最后获得最终的定位结果。2.根据权利要求1所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述S1网格采集包括连续型采集数据和离散型采集数据。3.根据权利要求2所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述连续型采集数据或离散型采集数据,都对应着一组已知接入点AP编号的RSS数据。4.根据权利要求1所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述S2...
【专利技术属性】
技术研发人员:赵军辉,曾龙基,杨涛,杜家娇,
申请(专利权)人:北京交通大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。