【技术实现步骤摘要】
网络接入点的位置估计方法与装置
本专利技术涉及地理定位,尤其是涉及网络接入点的定位技术。
技术介绍
在移动互联网应用中,经常要依据用户的地理位置进行个性化推荐或风控决策。通常获取用户地理位置的方法分为直接定位法和间接定位法。直接法是直接读取用户设备的GPS经纬度读数,该方法虽然简单精确,但会受制于建筑物遮挡GPS信号、设备GPS功能关闭、用户恶意篡改GPS读数等因素的影响,使用场景受限。另一种间接定位法是首先通过其他途经预先获取诸多移动基站、无线接入点等网络接入点的可能位置,然后根据用户终端设备当前连接的移动基站或无线接入点的唯一标识,其中唯一接入点中包含了例如移动基站所处的地理区域的地区区域码,查找用户终端设备可能处在的位置范围,再通过三角定位等方式最终确定该用户设备的位置。间接法精度低于直接法,但只要设备处于联网状态便能进行,并且用户难以恶意篡改位置,具有重要的价值。现有技术中,在预先估计网络接入点的位置时,针对收集的大量外部终端设备的经纬度信息,通常建立二维高斯分布模型,并选取模型中均值作为接入点中心坐标的估计。然而,由于数据漂移干扰的影响,导致所估计的均值存在较大误差,影响定位效果。此外,该方法不适用于对移动基站的位置的估计,因为在移动基站发生位置移动时,在多个观察时期内必然事实上存在多个物理位置,那么显然基于多个观察时期收集的数据建立二维高斯分布模型,并选取模型中值作为接入点的位置估计将产生严重的误差。
技术实现思路
本专利技术旨在提出一种估计移动基站或无线接入点的位置的方法和装置。根据本专利技术的一个方面,提供一种估计网络接入点的地理位置的方法,包 ...
【技术保护点】
1.一种估计网络接入点的地理位置的方法,包括:基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的物理位置信息;基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类,其中每个聚类包含该数据样本集中不同的数据样本;计算该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心,作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。
【技术特征摘要】
1.一种估计网络接入点的地理位置的方法,包括:基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的物理位置信息;基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类,其中每个聚类包含该数据样本集中不同的数据样本;计算该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心,作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。2.如权利要求1的方法,其中所述位置信息是所述外部终端设备在连接到所述网络接入点时的经纬度,并且所述物理距离是所述二个外部终端设备之间的球面距离。3.如权利要求2的方法,其中,对该数据样本集执行聚类处理以生成至少一个候选聚类包括:将所述数据样本集作为待聚类样本集,迭代执行以下循环聚类过程,直到满足聚类结束条件:选择待聚类样本集中的一个当前样本,将该待聚类样本集中与该当前样本之间的距离小于预定距离阈值的所有其它样本分类为对应于当前迭代过程的聚类,其中该聚类还包括该当前样本;在当前迭代过程未满足所述聚类结束条件时,从该待聚类样本集中去除该当前迭代过程的聚类中的样本,以得到用于下一迭代过程的待聚类样本集;在当前迭代过程满足聚类结束条件时,输出迭代执行过程中得到的聚类。4.如权利要求3的方法,其中所述聚类结束条件是当前迭代过程的聚类中的数据样本的数目小于聚类阈值,所述方法进一步包括:如果当前迭代过程的聚类中的数据样本的数目小于该聚类阈值,则从所述输出的聚类中去除当前迭代过程的聚类。5.如权利要求4的方法,其中所述迭代结束条件进一步包括:用于下一迭代过程的待聚类样本集的样本数小于所述聚类阈值。6.如权利要求1-5之一的方法,其中,所述预定评估条件包括:所述目标聚类中的数据样本数最大。7.如权利要求6的方法,其中每个数据样本还包括所述外部终端设备连接到所述网络接入点的时间信息,其中所述预定评估条件还包括:所述目标聚类中的数据样本距当前日期的接近程度。8.如权利要求7的方法,其中,当具有最大样本数的聚类的样本数量大于或等于一预设最大极限值时,采用该具有最大样本数的聚类作为所述目标聚类;否则从所述候选聚类中选择样本数排名靠前且同时距离所述当前日期靠前的一个聚类作为所述目标聚类。9.如权利要求8的方法,其中所述预设最大极限值是平均聚类样本数SAVG的k倍,其中1≤k≤K,其中K为所生成的至少一个候选聚类的聚类数量;其中平均聚类样本数SAVG定义为:SAVG=N÷K,其中N为所述数据样本集中的样本数。10.如权利要求8的方法,进一步包括:通过计算基尼不纯度IG来评估所估计的网络接入点的地理位置的固定程度。11.如权利要求2-5之一的方法,其中确定该至少一个聚类中满足预定评估条件的目标聚类的几何中心包括:将所述目标聚类中的每个数据样本所涉及的外部终端设备的经纬度转换为平面坐标;基于该平面坐标,计算该目标聚类中各数据样本中所涉及的外部终端设备的位置的几何中值;将该几何中值的平面坐标转换为经纬度作为所述地理中心。12.如权利要求11的方法,进一步包括确定所述目标聚类中各个样本距所述几何中值的距离的绝对值之间的中位差,作为所述网络接入点的定位精度。13.一种估计网络接入点的地理位置的装置,包括:数据获取模块,用于基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的位置信息;距离计算模块,用于基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据...
【专利技术属性】
技术研发人员:齐翔,周荣旺,吴新琪,王德胜,左星,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。