一种基于多种数据源实现用户常住地入楼的方法及系统技术方案

技术编号:33120356 阅读:16 留言:0更新日期:2022-04-17 00:18
本发明专利技术公开了一种基于多种数据源实现用户常住地入楼的方法及系统,属于用户常住地入楼技术领域,包括居住地范围内楼栋用户识别等步骤。本发明专利技术不依赖基站定位,降低因基站切换和基站覆盖范围大带来的定位准确误差率较高的影响;采用MR指纹库定位的方式分析计算用户常住地,提高用户定位准确率,并通过引入用户常住地和置信度概念,能够直观刻画用户常住地入楼的准确率;引入装机地址信息并和常住地相结合的方式,可认为筛选后的用户装机地址为准确的用户居住地地址,从而优化用户常住地入楼的结果,进而实现用户常住地入楼,可有效地应用到对内运维优化、精准营销,对外数据变现、行业应用支撑等场景中。业应用支撑等场景中。业应用支撑等场景中。

【技术实现步骤摘要】
一种基于多种数据源实现用户常住地入楼的方法及系统


[0001]本专利技术涉及用户常住地入楼
,具体涉及一种基于多种数据源实现用户常住地入楼的方法及系统。

技术介绍

[0002]随着移动物联网、物联网的不断发展,社会各个生产领域都在源源不断地产生大量的数据。数据资源被视为未来最重要的国家资产,大数据是数字经济发展的关键生产要素和社会基础性战略资源,已成为国际竞争的前沿地带,是推动经济发展质量变革、动力变革的重要战略手段,推动着未来人类社会生产、生活模式的改变和创新。电信运营商作为大数据的重要拥有者,其数据具备数量体大、类型多、真实、准确的特点;近些年电信运营商因传统业务发展饱和以及国家持续的提速降费、取消漫游费用等政策的限制,导致其传统业务收入不断下滑,急需拓展新的业务增长点,与此同时各国际运营商亦积极开展战略转型,布局大数据等新兴领域;所以围绕当前的数据金矿,充分挖掘、发挥数据价值是当前电信运营商的必走之路,而在诸多运营商数据核心能力中,位置能力就是其中之一,在对内运维优化、精准营销,对外数据变现、行业应用支撑等方面起着至关重要的作用。由于缺乏科学有效的定位方法,无法保证用户定位的位置精确度、无法提供定位结果的置信度;由于缺乏精准有效数据源的支撑,无法将用户定位到具体小区楼栋。
[0003]当前运营商最新主流的,能够提供较为准确位置能力的技术是基于MR的指纹定位技术;MR的全称是“Measurement Report”,即测量报告。是指移动终端通过控制信道,在业务信道上以一定时间间隔,以测量报告的方式向基站周期性上报所在小区的下行信号强度,质量等信息,基站将终端上报的下行信息和自身收集的上行物理信息上传给基站控制器,并由其收集与统计。MR记录了UE在业务保持过程中的服务小区/邻区ID、RSRP、RSRQ、TA、AOA、CQI、MCS、PHR等无线测量信息。上报的MR可用于系统中无线资源控制子层完成诸如切换等事件的触发,也可用于系统维护,观察系统的运行状态;位置指纹是指用户所处位置的场景特征。
[0004]传统的识别用户常住楼栋的方法是通过基站位置来分析识别,通过对一段周期内用户晚上的时间的基站分布情况,结合建筑物GIS信息,通过聚类分析算法,将用户识别到周边对应的建筑物楼栋内。在实际应用的过程中,有很大的局限性。首先,从基站分布情况来看,基站的覆盖范围较大,且受基站切换的影响,所能定位的范围也就越大,影响用户位置识别准确率。其次,不能从居住地的角度分析用户每天的居住地情况,不能给出能准确刻画用户居住楼栋的置信度参数。最后,没有引入装机地址等多维度数据源来优化用户常住地入楼。因此,许多对内运维优化、精准营销,对外数据变现、行业应用支撑等场景,很难应用到实际的生产生活中去。为此,提出一种基于多种数据源实现用户常住地入楼的方法。

技术实现思路

[0005]本专利技术所要解决的技术问题在于:如何解决传统识别用户常住楼栋的方法存在的
用户位置识别准确率低、不能给出能准确刻画用户居住楼栋的置信度参数等问题,提供了一种基于多种数据源实现用户常住地入楼的方法。
[0006]本专利技术是通过以下技术方案解决上述技术问题的,本专利技术包括以下步骤:
[0007]S1:居住地范围内楼栋用户识别
[0008]对用户常住地周边的建筑物楼栋进行识别,并计算用户常住地到设定距离范围内各个建筑物楼栋的距离;
[0009]S2:主副卡用户信息判断
[0010]根据同一个客户id对应的不同用户号码并按照号码开户日期排序,取出开户时间最早的号码即为主卡号码,其余则为副卡号码;再计算副卡号码常住地到主卡号码常住地距离是否在一定范围内,是则判定副卡号码和主卡号码用户住在同一楼栋内;
[0011]S3:建筑物名称与装机地址匹配
[0012]对于识别到建筑物楼栋且有装机地址的用户,采用余弦相似性与最大公共子字符串匹配率相结合的分析方式对建筑物楼栋和装机地址进行分析匹配,取出匹配率最高的建筑物楼栋作为用户的常住地楼栋;
[0013]S4:距离常住地范围内楼栋的置信度判断
[0014]对于识别到建筑物楼栋但没有装机地址的用户,采用常住地周边范围内的置信度最高的建筑物楼栋作为用户的常住地楼栋;
[0015]S5:直接采用用户常住地位置
[0016]对于用户常住地没有楼栋信息的用户,直接取其常住地经纬度信息作为用户的常住地楼栋;
[0017]S6:副卡用户常住地建筑物楼栋更新
[0018]对于已经识别出的主副卡号码对应关系可视为主副卡号码用户住在同一楼栋内,将识别出的副卡号码用户的常住地楼栋信息更新为和主卡号码一致。
[0019]更进一步地,在所述步骤S1中,设定距离范围为距用户常住地200m内。
[0020]更进一步地,在所述步骤S3中,建筑物楼栋和装机地址均为中文字符串。
[0021]更进一步地,在所述步骤S4中,置信度为日常住地距离建筑物楼栋50米范围内的天数/采样点总天数。
[0022]更进一步地,在所述步骤S4中,采用余弦相似性进行字符串比较时,每个词项被赋予不同的维度,而一个维度由一个向量表示,各个维度上的值对应于该词项在文档中出现的频率。
[0023]更进一步地,在所述步骤S4中,采用最大公共子字符串匹配率来比较两个字符串文本的相似度时,将待比较的字符串与被比较的字符串进行匹配,若成功,则记下匹配成功长度;若不成功,长度减1,继续匹配。一直循环下去,将所有匹配成功的子字符串长度累加,除以带匹配的字符串长度,算出占比,占比越大,则说明两字符串越相似。
[0024]本专利技术还提供了一种基于多种数据源实现用户常住地入楼的系统,采用上述的方法实现对用户常住地入楼的识别,包括:
[0025]楼栋识别模块,用于对用户常住地周边的建筑物楼栋进行识别,并计算用户常住地到设定距离范围内各个建筑物楼栋的距离;
[0026]主副卡判断模块,用于根据同一个客户id对应的不同用户号码并按照号码开户日
期排序,取出开户时间最早的号码即为主卡号码,其余则为副卡号码;再计算副卡号码常住地到主卡号码常住地距离是否在一定范围内,是则判定副卡号码和主卡号码用户住在同一楼栋内;
[0027]匹配模块,用于对识别到建筑物楼栋且有装机地址的用户,采用余弦相似性与最大公共子字符串匹配率相结合的分析方式对建筑物楼栋和装机地址进行分析匹配,取出匹配率最高的建筑物楼栋作为用户的常住地楼栋;
[0028]置信度判断模块,用于对识别到建筑物楼栋但没有装机地址的用户,采用常住地周边范围内的置信度最高的建筑物楼栋作为用户的常住地楼栋;
[0029]直接采用模块,用于对用户常住地没有楼栋信息的用户,直接取其常住地经纬度信息作为用户的常住地楼栋;
[0030]更新模块,用于对已经识别出的主副卡号码对应关系可视为主副卡号码用户住在同一楼栋内,将识别出的副卡号码用户的常住地楼栋信息更新为和主卡号码一致;
[0031本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多种数据源实现用户常住地入楼的方法,其特征在于,包括以下步骤:S1:居住地范围内楼栋用户识别对用户常住地周边的建筑物楼栋进行识别,并计算用户常住地到设定距离范围内各个建筑物楼栋的距离;S2:主副卡用户信息判断根据同一个客户id对应的不同用户号码并按照号码开户日期排序,取出开户时间最早的号码即为主卡号码,其余则为副卡号码;再计算副卡号码常住地到主卡号码常住地距离是否在预设范围内,是则判定副卡号码和主卡号码用户住在同一楼栋内;S3:建筑物名称与装机地址匹配对于识别到建筑物楼栋且有装机地址的用户,采用余弦相似性与最大公共子字符串匹配率相结合的分析方式对建筑物楼栋和装机地址进行分析匹配,取出匹配率最高的建筑物楼栋作为用户的常住地楼栋;S4:距离常住地范围内楼栋的置信度判断对于识别到建筑物楼栋但没有装机地址的用户,采用常住地周边范围内的置信度最高的建筑物楼栋作为用户的常住地楼栋;S5:直接采用用户常住地位置对于用户常住地没有楼栋信息的用户,直接取其常住地经纬度信息作为用户的常住地楼栋;S6:副卡用户常住地建筑物楼栋更新对于已经识别出的主副卡号码对应关系可视为主副卡号码用户住在同一楼栋内,将识别出的副卡号码用户的常住地楼栋信息更新为和主卡号码一致。2.根据权利要求1所述的一种基于多种数据源实现用户常住地入楼的方法,其特征在于:在所述步骤S1中,设定距离范围为距用户常住地200m内。3.根据权利要求1所述的一种基于多种数据源实现用户常住地入楼的方法,其特征在于:在所述步骤S3中,建筑物楼栋和装机地址均为中文字符串。4.根据权利要求3所述的一种基于多种数据源实现用户常住地入楼的方法,其特征在于:在所述步骤S4中,置信度为日常住地距离建筑物楼栋50米范围内的天数/采样点总天数。5.根据权利要求4所述的一种基于多种数据源实现用户常住地入楼的方法,其特征在于:在所述步骤S4中,采用余弦相似性进行字符串比较时,每个词项赋予不同的维度,一个...

【专利技术属性】
技术研发人员:穆健翔张海永赵龙丁兆强刘文明
申请(专利权)人:科大国创云网科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1