【技术实现步骤摘要】
本专利技术涉及一种从黑名单号码库中自动识别可释放号码的方法,属于网络通信
技术介绍
目前,黑名单号码库中的所有黑号码都是经过长时间的积累而形成的,越来越多的黑号码给网络存储带来压力。经过长期现网观察,当号码进入黑名单号码中被拦截之后,有很多骚扰诈骗分子会放弃使用这个号码,而更换其他号码进行非法活动。因此,黑号码在入黑后,如果在很长一段时间内这个号码的活跃度很低,那么就可以从黑名单号码库中释放这个黑号码,使之成为正常号码供用户使用。如何计算黑名单号码库中每个黑号码的活跃度,并识别活跃度低的黑号码以释放成为用户使用的正常号码,已成为技术人员急需解决的技术问题,目前还未发现相关技术解决方案。
技术实现思路
有鉴于此,本专利技术的目的是提供一种从黑名单号码库中自动识别可释放号码的方法,能准确计算黑名单号码库中每个黑号码的活跃度,并识别活跃度低的黑号码以释放成为用户使用的正常号码。为了达到上述目的,本专利技术提供了一种从黑名单号码库中自动识别可释放号码的方法,包括有:步骤一、构建多个在不同时间周期下的分类模型,其中,每个分类模型的输入是一个号码在对应时间周期下的若干通信指标,输出是该号码在对应时间周期下的活跃度;步骤二、从黑名单号码库中逐一提取每个黑号码,并将所述黑号码在不同时间周期下的若干通信指标分别输入到在对应时间周期下的分类模型中,当所述黑号码在所有时间周期下的分类模型中输出的活跃度均小于低活跃度阈值时,则所述黑号码是可释放号码。与现有技术相比,本专利技术的有益效果是:本专利技术通过黑名单号码库中所有黑号码入库后的多个通信指标,以及多个不同时间周期下的 ...
【技术保护点】
一种从黑名单号码库中自动识别可释放号码的方法,其特征在于,包括有:步骤一、构建多个在不同时间周期下的分类模型,其中,每个分类模型的输入是一个号码在对应时间周期下的若干通信指标,输出是该号码在对应时间周期下的活跃度;步骤二、从黑名单号码库中逐一提取每个黑号码,并将所述黑号码在不同时间周期下的若干通信指标分别输入到在对应时间周期下的分类模型中,当所述黑号码在所有时间周期下的分类模型中输出的活跃度均小于低活跃度阈值时,则所述黑号码是可释放号码。
【技术特征摘要】
1.一种从黑名单号码库中自动识别可释放号码的方法,其特征在于,包括有:步骤一、构建多个在不同时间周期下的分类模型,其中,每个分类模型的输入是一个号码在对应时间周期下的若干通信指标,输出是该号码在对应时间周期下的活跃度;步骤二、从黑名单号码库中逐一提取每个黑号码,并将所述黑号码在不同时间周期下的若干通信指标分别输入到在对应时间周期下的分类模型中,当所述黑号码在所有时间周期下的分类模型中输出的活跃度均小于低活跃度阈值时,则所述黑号码是可释放号码。2.根据权利要求1所述的方法,其特征在于,步骤一中,时间周期包括但不限于:日、周、月、季度或半年,分类模型采用但不限于:决策树、逻辑回归、随机森林、支持向量机或神经网络模型,不同时间周期下的分类模型的输入选取不同的通信指标,其中,日分类模型所输入的通信指标包括但不限于:呼叫频次、平均呼叫时间间隔;周分类模型所输入的通信指标包括但不限于:呼叫频次、被叫离散度、忙时呼叫率、最大呼叫日间隔、最小呼叫日间隔;月分类模型所输入的通信指标包括但不限于:呼叫频次、被叫离散度、忙时呼叫率、最大呼叫日间隔、最小呼叫日间隔、呼叫间隔日离散度;季度分类模型所输入的通信指标包括但不限于:呼叫频次、被叫离散度、忙时呼叫率、最大呼叫日间隔、最小呼叫日间隔、呼叫间隔日离散度;半年分类模型所输入的通信指标包括但不限于:呼叫频次、被叫离散度、忙时呼叫率、最大呼叫日间隔、最小呼叫日间隔、呼叫间隔日离散度。3.根据权利要求1所述的方法,其特征在于,还包括有:按照可释放号码在最大时间周期下的分类模型中输出的活跃度从小到大的次序,对所有可释放号码进行排序,然后从黑名单号码库中删除若干排序在前的可释放号码。4.根据权利要求1所述的方法,其特征在于,对于从黑名单号码库中提取的每个黑号码,步骤二进一步包括有:步骤21、将黑号码的活跃度重置数PS初始化为0,将黑号码的重置日期初始化为所述黑号码进入黑名单号码库的首日,并按照时间周期从小到大的顺序,选取最小的一个时间周期;步骤22、从黑号码的重置日期开始,顺序截取多个连续的、且时长为所选取的时间周期的时间段;步骤23、计算所述黑号码在多个连续的时间段内的若干通信指标,然后将每个时间段内的若干通信指标分别输入到在所述时间周期下的分类模型中,从而得到所述黑号码分别在每个时间段下的活跃度,并判断是否每个时间段下的活跃度均小于低活跃度阈值,如果是,则转向步骤24;步骤24、判断是否还有未选取的时间周期,如果是,则按照时间周期从小到大的顺序,继续选取下一个时间周期,然后转向步骤22;如果否,则所述黑号码是可释放号码,本流程结束。5.根据权利要求4所述的方法,其特征在于,步骤23中,当每个时间段下的活跃度不是均小于低活跃度阈值时,还包括有:更新活跃度重置数PS:PS=PS+1,并计算活跃度重置率PSL:PSL=PS/T_D,其中,T_D是所述黑号码进入黑名单号码库的总天数,然后判断活跃度重置率PSL是否大于一定阈值,如果是,则将所述黑号码保存到高活跃度号码库中,本流程结束;如果否,则将黑号码的重置日期更新成步骤23中活跃度大于或等于低活跃度阈值的最后一个时间段之后的日期,然后转向步骤22。6.根据权利要求5所述的方法,其特征在于,还包...
【专利技术属性】
技术研发人员:刘瑶,张锦然,吉立妍,张煊,王昊,王娜,
申请(专利权)人:杭州东信北邮信息技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。