网络接入点的位置估计方法与装置制造方法及图纸

技术编号:22025525 阅读:59 留言:0更新日期:2019-09-04 02:14
本发明专利技术的实施例提供估计网络接入点的地理位置的方法和装置。该方法包括:基于待估计的网络接入点的标识,获取数据样本集,其中每个数据样本包括连接到该网络接入点的外部终端设备的位置信息;基于外部终端设备的位置信息,计算每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类;将该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。

Location Estimation Method and Device for Network Access Points

【技术实现步骤摘要】
网络接入点的位置估计方法与装置
本专利技术涉及地理定位,尤其是涉及网络接入点的定位技术。
技术介绍
在移动互联网应用中,经常要依据用户的地理位置进行个性化推荐或风控决策。通常获取用户地理位置的方法分为直接定位法和间接定位法。直接法是直接读取用户设备的GPS经纬度读数,该方法虽然简单精确,但会受制于建筑物遮挡GPS信号、设备GPS功能关闭、用户恶意篡改GPS读数等因素的影响,使用场景受限。另一种间接定位法是首先通过其他途经预先获取诸多移动基站、无线接入点等网络接入点的可能位置,然后根据用户终端设备当前连接的移动基站或无线接入点的唯一标识,其中唯一接入点中包含了例如移动基站所处的地理区域的地区区域码,查找用户终端设备可能处在的位置范围,再通过三角定位等方式最终确定该用户设备的位置。间接法精度低于直接法,但只要设备处于联网状态便能进行,并且用户难以恶意篡改位置,具有重要的价值。现有技术中,在预先估计网络接入点的位置时,针对收集的大量外部终端设备的经纬度信息,通常建立二维高斯分布模型,并选取模型中均值作为接入点中心坐标的估计。然而,由于数据漂移干扰的影响,导致所估计的均值存在较大误差,影响定位效果。此外,该方法不适用于对移动基站的位置的估计,因为在移动基站发生位置移动时,在多个观察时期内必然事实上存在多个物理位置,那么显然基于多个观察时期收集的数据建立二维高斯分布模型,并选取模型中值作为接入点的位置估计将产生严重的误差。
技术实现思路
本专利技术旨在提出一种估计移动基站或无线接入点的位置的方法和装置。根据本专利技术的一个方面,提供一种估计网络接入点的地理位置的方法,包括:基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的位置信息;基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类,其中每个聚类包含该数据样本集中不同的数据样本;将该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。根据本专利技术的另一个方面,提供一种估计网络接入点的地理位置的装置,包括:数据获取模块,用于基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的位置信息;距离计算模块,用于基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;聚类模块,用于基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类,其中每个聚类包含该数据样本集中不同的数据样本;位置确定模块,用于将该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。此外,根据本专利技术,还提供一种具有指令的计算机可读介质,所述指令在被一个或多个计算系统执行时,使所述计算系统执行根据本专利技术的方法。此外,根据本专利技术,还提供一种位置估计装置,包括:存储指令的存储器;处理器,可配置为执行所述指令以实现本专利技术的方法。根据本专利技术实现的位置估计方案,具有噪声不敏感的特点,可以适用于网络接入点例如移动基站的位置经常变化的场合。根据本专利技术的方案,可以消除由于漂移等因素对网络接入点位置估计的干扰,尤其是特别适合于移动基站的位置的估计。附图说明图1示出根据本专利技术一个示例性的位置估计装置的示意图;图2示出根据本专利技术一个示例性的地址估计方法流程图;图3示出根据本专利技术一个示例性的数据聚类方法流程图;图4示出根据本专利技术另一个示例性的数据聚类方法流程图;图5示出了根据本专利技术一个实施例的确定目标聚类方法流程图;图6示出了根据本专利技术一个实施例的计算设备的示意图。具体实施方式下面结合附图对本专利技术实施例提供的装置与方法及进行详细说明。虽然附图中显示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本公开更加透彻和完整,并且能够将本公开的范围完整的传达给本领域的技术人员。在以下实施例中,以移动基站为例描述本专利技术的确定移动基站地址的方案,但这些方案同样适用于其它可提供网络接入服务的设备。移动基站作为网络接入点,具有唯一的身份特征,例如设备序列号(SID);同时在提供网络接入服务时,还具有区域性特征,例如该区域性特征是通信网络系统赋与该移动基站的地区区域码(LAC)。移动基站可在不同的时间、不同的地点为相同或不同的外部终端设备例如用户设备(Ud)提供网络接入。按照本专利技术,收集用户设备连接到移动基站时的历史连接信息,这些历史连接信息包括用户设备在连接到移动基站时的位置信息,例如经纬度;所连接的移动站的唯一标识UID,标识UID包括该移动站提供网络接入服务时的地区区域码(LAC)以及身份标识SID;历史连接信息还可以包括用户设备在连接到移动基站的时间信息。因此,基于历史连接信息,可收集到不同移动基站提供网络接入服务时的数据,而本专利技术可利用这些数据为基站估计其在提供服务时的具体地址。图1示出了根据本专利技术一个实施例的位置估计装置100的示意图。如图所示,位置估计装置100包括数据获取模块102、距离计算模块104、聚类模块106以及位置确定模块108。如图所示,位置估计装置100可与记录有用户设备的网络连接历史信息的数据源200通信。为了基于这些历史信息来估计移动基站的地理位置,数据获取模块102基于数据源200中记录的网络连接历史信息构造数据样本X,按照一个实施例,每个数据样本可以是二元数据,即X=(uid,xLL),其中uid代表在本次网络连接活动中用户设备所连接的移动基站的标识UID,例如可以包括地区区域码LAC以及身份标识SID,而xLL表示在本次网络连接活动中连接到移动基站的用户设备的位置信息,例如该位置信息是用户设备的经纬度。不难理解,由于移动基站的移动性质,例如从一个城市移动到另一个城市,即使对于同一移动基站,由于在不同的城市间切换时地区区域码(LAC)会发生变化,因此按照本专利技术,该移动基站的UID已经发生变化,因此按照本专利技术,具有同一SID但不同LAC的基站视为不同的移动基站,其具有不同的UID。在另一实施例中,数据获取模块102形成的数据样本X还可以是三元数据,即X=(t,uid,xLL),其中t代表在本次网络连接活动中用户设备连接到移动基站的时间。以此方式,数据获取模块102可利用数据源200中记录的网络连接历史信息为每次网络连接活动构造出相应的数据样本,其中不同的数据样本对应于同一移动基站在在相同的时间服务于不同的用户设备或在不同的时间服务于不同的用户设备,或者不同的移动基站在相同或不同的时间服务于相同或不同的用户设备。地址估计设备100可利用这样得到的数据样本按照移动基站的标识UID来对每一基站的具体地理位置或地址进行估计。按照本本文档来自技高网...

【技术保护点】
1.一种估计网络接入点的地理位置的方法,包括:基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的物理位置信息;基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类,其中每个聚类包含该数据样本集中不同的数据样本;计算该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心,作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。

【技术特征摘要】
1.一种估计网络接入点的地理位置的方法,包括:基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的物理位置信息;基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据样本所涉及的二个外部终端设备的物理位置之间的物理距离;基于该物理距离,对该数据样本集执行聚类处理以生成至少一个候选聚类,其中每个聚类包含该数据样本集中不同的数据样本;计算该至少一个候选聚类中满足预定评估条件的目标聚类的几何中心,作为该网络接入点的地理位置,其中几何中心是该目标聚类中各数据样本中所涉及的外部终端设备的位置的地理中心。2.如权利要求1的方法,其中所述位置信息是所述外部终端设备在连接到所述网络接入点时的经纬度,并且所述物理距离是所述二个外部终端设备之间的球面距离。3.如权利要求2的方法,其中,对该数据样本集执行聚类处理以生成至少一个候选聚类包括:将所述数据样本集作为待聚类样本集,迭代执行以下循环聚类过程,直到满足聚类结束条件:选择待聚类样本集中的一个当前样本,将该待聚类样本集中与该当前样本之间的距离小于预定距离阈值的所有其它样本分类为对应于当前迭代过程的聚类,其中该聚类还包括该当前样本;在当前迭代过程未满足所述聚类结束条件时,从该待聚类样本集中去除该当前迭代过程的聚类中的样本,以得到用于下一迭代过程的待聚类样本集;在当前迭代过程满足聚类结束条件时,输出迭代执行过程中得到的聚类。4.如权利要求3的方法,其中所述聚类结束条件是当前迭代过程的聚类中的数据样本的数目小于聚类阈值,所述方法进一步包括:如果当前迭代过程的聚类中的数据样本的数目小于该聚类阈值,则从所述输出的聚类中去除当前迭代过程的聚类。5.如权利要求4的方法,其中所述迭代结束条件进一步包括:用于下一迭代过程的待聚类样本集的样本数小于所述聚类阈值。6.如权利要求1-5之一的方法,其中,所述预定评估条件包括:所述目标聚类中的数据样本数最大。7.如权利要求6的方法,其中每个数据样本还包括所述外部终端设备连接到所述网络接入点的时间信息,其中所述预定评估条件还包括:所述目标聚类中的数据样本距当前日期的接近程度。8.如权利要求7的方法,其中,当具有最大样本数的聚类的样本数量大于或等于一预设最大极限值时,采用该具有最大样本数的聚类作为所述目标聚类;否则从所述候选聚类中选择样本数排名靠前且同时距离所述当前日期靠前的一个聚类作为所述目标聚类。9.如权利要求8的方法,其中所述预设最大极限值是平均聚类样本数SAVG的k倍,其中1≤k≤K,其中K为所生成的至少一个候选聚类的聚类数量;其中平均聚类样本数SAVG定义为:SAVG=N÷K,其中N为所述数据样本集中的样本数。10.如权利要求8的方法,进一步包括:通过计算基尼不纯度IG来评估所估计的网络接入点的地理位置的固定程度。11.如权利要求2-5之一的方法,其中确定该至少一个聚类中满足预定评估条件的目标聚类的几何中心包括:将所述目标聚类中的每个数据样本所涉及的外部终端设备的经纬度转换为平面坐标;基于该平面坐标,计算该目标聚类中各数据样本中所涉及的外部终端设备的位置的几何中值;将该几何中值的平面坐标转换为经纬度作为所述地理中心。12.如权利要求11的方法,进一步包括确定所述目标聚类中各个样本距所述几何中值的距离的绝对值之间的中位差,作为所述网络接入点的定位精度。13.一种估计网络接入点的地理位置的装置,包括:数据获取模块,用于基于待估计的网络接入点的标识,获取数据样本集,该数据样本集包含与该网络接入点相关的多个数据样本,其中每个数据样本包括连接到该网络接入点的外部终端设备的位置信息;距离计算模块,用于基于每个数据样本中的外部终端设备的位置信息,计算该数据样本集中每二个数据...

【专利技术属性】
技术研发人员:齐翔周荣旺吴新琪王德胜左星
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1