一种基于基站定位的固定人群手机号筛查方法技术

技术编号:33391965 阅读:27 留言:0更新日期:2022-05-11 23:09
本发明专利技术提出了一种基于基站定位的固定人群手机号筛查方法,包括以下步骤:S1,采集数据;S2,将采集的数据发送至平台;S3,平台对数据进行分析;S4,向用户前端输出分析结果。本发明专利技术能够通过运营商基站定位SIM卡位置获得在某区域内的手机号码,并根据条件筛选出该区域常住人口的手机号码。住人口的手机号码。住人口的手机号码。

【技术实现步骤摘要】
一种基于基站定位的固定人群手机号筛查方法


[0001]本专利技术涉及定位
,特别是涉及一种基于基站定位的固定人群手机号筛查方法。

技术介绍

[0002]云通信业务因其方便快捷、性价比高的优势深受企业及政府部门青睐,现目前企业及政府单位所发送的对象均通过用户注册、信息收集、渠道购买等方式获得。获取方式相对被动且准确度不高。本专利技术旨在解决如何通过运营商基站定位SIM卡位置获得在某区域内的手机号码,并根据条件筛选出该区域常住人口的手机号码。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于基站定位的固定人群手机号筛查方法。
[0004]为了实现本专利技术的上述目的,本专利技术提供了一种基于基站定位的固定人群手机号筛查方法,包括以下步骤:
[0005]S1,采集数据;包括满足条件的手机号和手机短信。
[0006]S2,将采集的数据发送至平台;
[0007]S3,平台对数据进行分析;
[0008]S4,向用户前端输出分析结果。
[0009]进一步地,所述S1中的采集数据包括:
[0010]S1

1,根据第一条件和第二条件设置定时采集任务;
[0011]S1

2,通过采集任务依次向运营商的基站软件发送数据请求。
[0012]进一步地,所述第一条件为人的休息位置,当处于相同位置连续ζ小时,则该区域为休息位置;第二条件为人的休息时间;所述采集任务包括采集时间、采集区域。
[0013]进一步地,所述S2中的采集数据包括:
[0014]S2

1,运营商基站软件接收到平台的数据请求后,将采集的数据发送至平台;
[0015]S2

2,通过基站位置数据库和地图数据配合,对SIM卡中的通信ID进行定位,将在该采集时间并在该采集区域的手机号码通过接口将数据发送至平台;
[0016]S2

3,将基站软件返回数据按照所述采集任务的类别分别存入不同的数据表中。
[0017]进一步地,所述S3包括:
[0018]S3

1,使用SQL语句对数据库中的数据表进行数据比对查重,找出重复的数据;
[0019]S3

2,判断重复的数据出现的次数是否超过阈值,若超过则为区域常住人口。
[0020]进一步地,还包括:
[0021]所述采集的信息还包括短信,通过对短信的数据分析筛查出有害信息,利用基站定位对发出有害信息的SIM卡进行追踪。
[0022]进一步地,所述通过对短信的数据分析筛查出有害信息包括:
[0023]S1,通过包含黑名单和白名单的数据集对AI智能识别系统进行训练;以及采用分词技术提取数据集中的关键信息,对AI智能识别系统训练;
[0024]S2,通过正则表达式对短信做初步筛查,判断短信内容中是否包含手机号码、链接、IP地址、验证码之一或者任意组合,若存在,则拦截率增加O,执行步骤S5;若不存在,O为0,执行下一步骤;其中O表示基于初步筛查的短信有害概率值;
[0025]S3,将短信输入训练好的AI智能识别系统,对短信采用分词技术,计算最大信息冗余MIR,然后进行第一次通过判断,若通过所述第一次通过判断且O为0,则短信通过;若不通过所述第一次通过判断则计算出基于短信冗余度的短信有害概率值 Q1;
[0026]S4,将分词插入到分词词库中,计算基于分词属性的短信有害概率值Q2,然后进行第二次通过判断,若通过所述第二次通过判断且O为0,则短信通过;若不通过所述第二次通过判断则计算出拦截率Q;
[0027]S5,将拦截率Q与最小阈值、最大阈值进行比较:若小于最小阈值则短信通过,若大于最大阈值则短信拦截;若处于最小阈值~最大阈值之间则将该条短信将转至人工审核库,待人工审核进行通过;其中最小阈值小于最大阈值。
[0028]进一步地,进一步地,所述AI智能识别系统包括CNN卷积网络。
[0029]进一步地,所述S3包括:
[0030]S3

1,运用word分词技术将短信的文本内容拆分成若干个词;
[0031]S3

2,删除停用词;
[0032]S3

3,将各个分词进行排列得到特征向量,作为AI智能识别系统卷积层的输入;
[0033]S3

4,计算最大信息冗余MIR,并进行第一次通过判断,若不通过则执行下一步骤;
[0034]S3

5,计算出基于短信冗余度的短信有害概率值Q1。
[0035]进一步地,所述S3

3中的卷积层采用多个不同尺寸的卷积核,有助于捕捉不同维度的信息。
[0036]所述每个卷积核提取出不同的类型特征,得到不同的特征维度信息:
[0037][0038]其中J
k
表示第k个卷积核对应的特征维度信息;
[0039]θ(
·
)表示激活函数;
[0040]K表示卷积核的个数;
[0041]d
k
表示第k个卷积核的特征值;
[0042]为卷积运算;
[0043]F
ik
表示第k个卷积核时第i层的特征;
[0044]F
ik
‑1表示第k

1个卷积核时第i层的特征;
[0045]b表示影响因子。
[0046]进一步地,所述S3

4包括:
[0047]MIR=[y(x)

t][0048]其中x表示短信的字符数;
[0049]y(x)表示x的冗余值;
[0050]t表示当前信号通道值;
[0051][]表示截断取整;
[0052]冗余值y(x)的计算公式如下:
[0053][0054]其中m、n表示偏移调整系数;
[0055]S表示短信的来源种类数,有网站公司,虚拟平台,以及个人用户端;
[0056]h
s
表示来源s的信道频率系数;
[0057]p(x)表示x需要的网关通信量;
[0058]然后对冗余值y(x)进行第一次通过判断:
[0059](1)当x趋近于0时,趋近于一个常数,
[0060](2)MIR≤δ,δ为设定的最大冗余值,
[0061]若通过第一次通过判断且基于初步筛查的短信有害概率值O=0,则拦截率Q为0,短信通过;此时短信为无效内容,例如空白短信,单纯无逻辑的符号等。
[0062]进一步地,所述S3

5包括:
[0063][0064]其中Q1表示基于短信冗余度的短信有害概率值;
[0065]L表示特征向量的行列数,若不足位数,则用0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基站定位的固定人群手机号筛查方法,其特征在于,包括以下步骤:S1,采集数据;S2,将采集的数据发送至平台;S3,平台对数据进行分析;S4,向用户前端输出分析结果。2.根据权利要求1所述的一种基于基站定位的固定人群手机号筛查方法,其特征在于,所述S1中的采集数据包括:S1

1,根据第一条件和第二条件设置定时采集任务;S1

2,通过采集任务依次向运营商的基站软件发送数据请求。3.根据权利要求2所述的一种基于基站定位的固定人群手机号筛查方法,其特征在于,所述第一条件为人的休息位置,第二条件为人的休息时间;所述采集任务包括采集时间、采集区域。4.根据权利要求1所述的一种基于基站定位的固定人群手机号筛查方法,其特征在于,所述S2中的采集数据包括:S2

1,运营商基站软件接收到平台的数据请求后,将采集的数据发送至平台;S2

2,通过...

【专利技术属性】
技术研发人员:陈尧
申请(专利权)人:重庆华唐云树科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1