System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能,特别是涉及一种异常号码的识别方法、一种异常号码的识别装置、一种电子设备以及一种计算机可读存储介质。
技术介绍
1、在相关技术中,对于用户号码的异常号码识别方法,通常都具有高命中率、低覆盖率或低命中率、高覆盖率的问题,在对潜在的异常号码进行识别预判的过程中,应该确保其具有较高的真实异常号码覆盖率,但是往往会导致异常号码的识别命中率较低,从而在对识别预判的异常号码进行批量停机的时候会有很大一部分正常号码被停机,影响用户的正常使用。
技术实现思路
1、本专利技术实施例是提供一种异常号码的识别方法、装置、电子设备以及计算机可读存储介质,以解决或部分解决对号码进行异常识别时,存在识别不准确,影响正常号码的使用的问题。
2、本专利技术实施例公开了一种异常号码的识别方法,包括:
3、从数据库中获取全量号码以及各个所述号码对应的号码特征;
4、将所述号码特征输入至异常指数评分模型进行异常评分,获得所述号码对应的异常评分,并基于所述异常评分从所述全量号码中筛选出疑似异常号码;
5、将所述疑似异常号码的号码特征输入正常用户召回模型进行置信度预测,获得所述疑似异常号码的置信度;
6、根据所述置信度从所述疑似异常号码中过滤正常号码,并将剩余的号码作为异常号码,发起针对所述异常号码的停机申请。
7、在一些可选的实施例中,所述将所述号码特征输入至异常指数评分模型进行异常评分,获得所述号码对应的异常评分,包括:
>8、将所述号码特征输入至异常指数评分模型进行异常评分,获得各个所述号码特征对应的特征分值;
9、采用所述特征分值进行权重计算,获得所述号码特征对应的权重系数;
10、采用所述权重系数与所述特征分值进行加权求和,获得所述号码对应的异常评分。
11、在一些可选的实施例中,所述号码特征包括正向特征以及负向特征,所述采用所述特征分值进行权重计算,获得所述号码特征对应的权重系数,包括:
12、采用所述正向特征或所述负向特征对目标号码特征的特征分值进行归一化处理,获得所述目标号码特征对应的标准值;
13、针对目标号码特征,将各个所述号码对应的标准值进行加和,获得所述目标号码特征对应的标准总值,并计算各个所述标准值在所述标准总值中的比重;
14、采用所述比重进行熵值计算,获得所述目标号码特征对应的信息熵冗余度;
15、采用所述信息熵冗余度进行计算,获得所述目标号码特征对应的权重系数。
16、在一些可选的实施例中,假设xij为第i个号码的第j个号码特征对应的特征分值,i=1,2,…,n,n为全量号码数,j=1,2,…,n,n为号码特征个数,则采用所述正向特征或所述负向特征对目标号码特征的特征分值进行归一化处理,获得所述目标号码特征对应的标准值,通过如下公式实现:
17、
18、
19、其中,式(1)为采用正向特征进行处理的过程,式(2)为采用负向特征进行处理的过程。
20、在一些可选的实施例中,所述基于所述异常评分从所述全量号码中筛选出疑似异常号码,包括:
21、将异常评分大于预设评分阈值的号码作为疑似异常号码;
22、将异常评分小于或等于预设评分阈值的号码作为正常号码。
23、在一些可选的实施例中,还包括:
24、获取历史异常号码;
25、对所述号码对应的异常评分进行归一化处理,获得归一化后的异常评分;
26、按照归一化后的异常评分,从高到低进行降序排序,并等分为n个区间;
27、选取前k个区间的累计号码,以历史异常号码的样本数作为分母,以前k个区间的累计号码的数量作为分子,计算针对所述前k个区间的累计号码的召回率,所述k小于等于所述n;
28、从所述若干个区间中,选定召回率大于或等于预设召回率阈值、且归一化后的异常评分最小的目标区间,并将所述目标区间中的异常评分下限作为所述预设评分阈值。
29、在一些可选的实施例中,所述根据所述置信度从所述疑似异常号码中过滤正常号码,并将剩余的号码作为异常号码,发起针对所述异常号码的停机申请,包括:
30、将置信度小于或等于预设置信度阈值的疑似异常号码作为正常号码,从所述疑似异常号码中过滤所述正常号码,并将剩余的号码作为异常号码;
31、发起针对所述异常号码的停机申请。
32、在一些可选的实施例中,所述正常用户召回模型通过如下方式训练:
33、获取训练样本以及正常用户召回模型,所述训练样本包括历史疑似异常号码以及历史正常号码,所述历史正常号码为被认定为疑似异常号码后经过复通审查的号码,所述正常用户召回模型至少包括若干个基线模型以及元分类器;
34、将历史疑似异常号码作为正例样本,将历史正常号码作为负例样本;
35、将所述正例样本与所述负例样本分别输入至各个所述基线模型进行第一层的置信度预测,获得各个所述基线模型输出的预测置信度;
36、将各个所述基线模型输出的预测置信度输出至所述元分类器进行第二层的置信度预测,获得目标预测结果,并根据所述目标预测结果反向对所述正常用户召回模型进行反向迭代,直至损失函数满足条件,停止迭代,获得训练完成的正常用户召回模型。
37、本专利技术实施例还公开了一种异常号码的识别装置,包括:
38、号码获取模块,用于从数据库中获取全量号码以及各个所述号码对应的号码特征;
39、号码评分模块,用于将所述号码特征输入至异常指数评分模型进行异常评分,获得所述号码对应的异常评分,并基于所述异常评分从所述全量号码中筛选出疑似异常号码;
40、置信度预测模块,用于将所述疑似异常号码的号码特征输入正常用户召回模型进行置信度预测,获得所述疑似异常号码的置信度;
41、号码处理模块,用于根据所述置信度从所述疑似异常号码中过滤正常号码,并将剩余的号码作为异常号码,发起针对所述异常号码的停机申请。
42、在一些可选的实施例中,所述号码评分模块具体用于:
43、将所述号码特征输入至异常指数评分模型进行异常评分,获得各个所述号码特征对应的特征分值;
44、采用所述特征分值进行权重计算,获得所述号码特征对应的权重系数;
45、采用所述权重系数与所述特征分值进行加权求和,获得所述号码对应的异常评分。
46、在一些可选的实施例中,所述号码特征包括正向特征以及负向特征,所述号码评分模块具体用于:
47、采用所述正向特征或所述负向特征对目标号码特征的特征分值进行归一化处理,获得所述目标号码特征对应的标准值;
48、针对目标号码特征,将各个所述号码对应的标准值进行加和,获得所述目标号码特征对应的标准总值,并计算各个所述标准值在所述标准总值中的比重;
4本文档来自技高网...
【技术保护点】
1.一种异常号码的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述号码特征输入至异常指数评分模型进行异常评分,获得所述号码对应的异常评分,包括:
3.根据权利要求2所述的方法,其特征在于,所述号码特征包括正向特征以及负向特征,所述采用所述特征分值进行权重计算,获得所述号码特征对应的权重系数,包括:
4.根据权利要求3所述的方法,其特征在于,假设Xij为第i个号码的第j个号码特征对应的特征分值,i=1,2,…,n,n为全量号码数,j=1,2,…,m,m为号码特征个数,则采用所述正向特征或所述负向特征对目标号码特征的特征分值进行归一化处理,获得所述目标号码特征对应的标准值,通过如下公式实现:
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述异常评分从所述全量号码中筛选出疑似异常号码,包括:
6.根据权利要求5所述的方法,其特征在于,还包括:
7.根据权利要求1所述的方法,其特征在于,所述根据所述置信度从所述疑似异常号码中过滤正常号码,并将剩余的号码作为异常号码,发
8.根据权利要求1所述的方法,其特征在于,所述正常用户召回模型通过如下方式训练:
9.一种异常号码的识别装置,其特征在于,包括:
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,所述处理器、所述通信接口以及所述存储器通过所述通信总线完成相互间的通信;
11.一种计算机可读存储介质,其上存储有指令,当由一个或多个处理器执行所述指令时,使得所述处理器执行如权利要求1-8任一项所述的方法。
...【技术特征摘要】
1.一种异常号码的识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述将所述号码特征输入至异常指数评分模型进行异常评分,获得所述号码对应的异常评分,包括:
3.根据权利要求2所述的方法,其特征在于,所述号码特征包括正向特征以及负向特征,所述采用所述特征分值进行权重计算,获得所述号码特征对应的权重系数,包括:
4.根据权利要求3所述的方法,其特征在于,假设xij为第i个号码的第j个号码特征对应的特征分值,i=1,2,…,n,n为全量号码数,j=1,2,…,m,m为号码特征个数,则采用所述正向特征或所述负向特征对目标号码特征的特征分值进行归一化处理,获得所述目标号码特征对应的标准值,通过如下公式实现:
5.根据权利要求1至4任一项所述的方法,其特征在于,所述基于所述异常评...
【专利技术属性】
技术研发人员:马俊华,林立君,
申请(专利权)人:中国电信股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。