异常通信号码的识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37357758 阅读:12 留言:0更新日期:2023-04-27 07:07
本申请属于人工智能领域,涉及异常通信号码的识别方法、装置、存储介质及电子设备。包括:获取与目标特征对应的多组通信数据,对所述通信数据进行预处理以生成数据宽表,其中各组所述通信数据对应不同的通信号码;对所述数据宽表中的通信数据进行标准化处理,并将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分;获取与所述目标特征中的关键特征所对应的目标通信数据,将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所述通信号码进行分类,以输出与各所述通信号码对应的分类信息。本申请能够提高异常通信号码的识别准确率。信号码的识别准确率。信号码的识别准确率。

【技术实现步骤摘要】
异常通信号码的识别方法、装置、存储介质及电子设备


[0001]本申请涉及人工智能
,特别涉及一种异常通信号码的识别方法、异常通信号码的识别系统、计算机存储介质及电子设备。

技术介绍

[0002]目前社会上频发电信诈骗案件,电信诈骗不但使受害者蒙受财产甚至人身损失,而且会损害社会信任环境、破坏社会和谐稳定。
[0003]在预防和打击电信诈骗中,电信运营商积极参与,维护正常电信秩序,保障社会公众的正当权益;目前该领域对电信诈骗的预防和识别上没有较为完备的智能系统与方案,因此亟需创新研究一种异常通信号码的识别方法,以将识别到的异常通信号码提供给相关部门做关停等处理,从而可以有效预防电信诈骗案件发生,营造有效遏制电信诈骗的法制环境,同时在降低用户投诉率上也将起到至关重要的作用。
[0004]需要说明的是,上述
技术介绍
部分公开的信息仅用于加强对本申请的背景的理解。

技术实现思路

[0005]本申请的目的在于提供一种异常通信号码的识别方法、异常通信号码的识别系统、计算机存储介质及电子设备,进而至少在一定程度上提高对异常通信号码的检测准确率。
[0006]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0007]根据本申请的第一方面,提供一种异常通信号码的识别方法,包括:
[0008]获取与目标特征对应的多组通信数据,对所述通信数据进行预处理以生成数据宽表,其中各组所述通信数据对应不同的通信号码;对所述数据宽表中的通信数据进行标准化处理,并将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分;获取与所述目标特征中的关键特征所对应的目标通信数据,将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所述通信号码进行分类,以输出与各所述通信号码对应的分类信息。
[0009]根据本申请的第二方面,提供一种异常通信号码的识别装置,包括:
[0010]宽表生成模块,用于获取与目标特征对应的多组通信数据,对所述通信数据进行预处理以生成数据宽表,其中各组所述通信数据对应不同的通信号码;评分模块,用于对所述数据宽表中的通信数据进行标准化处理,并将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分;分类模块,用于获取与所述目标特征中的关键特征所对应的目标通信数据,将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所
述通信号码进行分类,以输出与各所述通信号码对应的分类信息。
[0011]在本申请的一个实施例中,所述宽表生成模块配置为:对所述用户特征数据进行数据清洗和数据整合,以生成所述数据宽表,其中,所述数据清洗是进行异常值处理和缺失值处理,所述数据整合是将不同途径获取的相同特征对应的数据进行整合。
[0012]在本申请的一个实施例中,所述评分模块配置为:
[0013]当所述通信数据的值越大,所述通信号码为异常号码的概率越大时,根据公式(1)进行所述标准化处理:
[0014][0015]当所述通信数据的值越大,所述通信号码为异常号码的概率越小时,根据公式(2)进行所述标准化处理:
[0016][0017]其中,X
ij
为第i个通信号码对应第j个特征的通信数据,X
ij*
为对X
ij
进行标准化处理后得到的数据,min(X
j
)为所有通信号码对应的第j个特征中的最小通信数据,max(X
j
)为所有通信号码对应的第j个特征中的最大通信数据。
[0018]在本申请的一个实施例中,所述目标特征包括多个特征;所述评分模块配置为:获取与各所述特征对应的熵权值,将与各所述特征对应的熵权值和标准化处理后的通信数据相乘,以获取与各所述特征对应的子评分;将所有所述特征对应的所述子评分相加,以获取所述异常评分。
[0019]在本申请的一个实施例中,所述关键特征为呼出离散度和拒接次数;所述分类模块包括:输入单元,用于将与各所述通信号码对应且特征为呼出离散度和拒接次数的目标通信数据以及与各所述通信号码对应的异常评分输入至所述分类模型;分类单元,用于通过所述分类模型根据预设规则对所述目标通信数据和所述异常评分进行处理,以获取与各所述通信号码对应的分类信息;其中,所述预设规则是根据异常评分、呼出离散度和拒接次数所确定的规则。
[0020]在本申请的示例性实施例中,所述分类模型为决策树模型或者随机森林模型;所述预设规则包括第一规则、第二规则和第三规则,所述第一规则的表达式为:异常评分>异常评分阈值and呼出离散度>第一呼出离散度阈值and拒接次数>第一拒接次数阈值,所述第二规则的表达式为:异常评分>异常评分阈值and呼出离散度∈呼出离散度区间and拒接次数>第二拒接次数阈值,所述第三规则的表达式为:异常评分>异常评分阈值and呼出离散度<第二呼出离散度阈值and拒接次数>第二拒接次数阈值,其中,所述第一呼出离散度阈值不同于所述第二呼出离散度阈值,所述第一拒接次数阈值不同于所述第二拒接次数阈值。
[0021]在本申请的示例性实施例中,所述分类单元配置为:当所述目标通信数据和所述异常评分满足所述第一规则时,判定所述通信号码为欺诈骚扰号码;当所述目标通信数据和所述异常评分满足所述第二规则时,判定所述通信号码为具有异常行为的通信号码;当所述目标通信数据和所述异常评分满足所述第三规则时,判定所述通信号码为定向骚扰号码。
[0022]在本申请的示例性实施例中,当所述通信号码为欺诈骚扰号码时,所述异常通信号码的识别装置还配置为:对所述欺诈骚扰号码对应的异常评分进行百分制转换,以获取
与所述异常评分对应的百分制数值;将所述百分制数值与第一阈值和第二阈值进行比较;当所述百分制数值大于或等于所述第一阈值时,将所述通信号码标记为高度疑似欺诈骚扰号码;当所述百分制数值大于或等于所述第二阈值且小于所述第一阈值时,将所述通信号码标记为中度疑似欺诈骚扰号码;当所述百分制数值小于所述第二阈值时,将所述通信号码标记为低度疑似欺诈骚扰号码。
[0023]在本申请的示例性实施例中,所述异常通信号码的识别装置还配置为:在将标准化处理后的所述通信数据输入至熵权法模型之前,获取与标记为欺诈骚扰号码的通信号码对应且与所述目标特征对应的通信数据样本;对所述通信数据样本进行预处理和标准化处理,以获取目标通信数据样本;根据所述目标通信数据样本确定第i个欺诈骚扰号码对应第j个目标特征的特征比重;根据所述特征比重确定所述第i个欺诈骚扰号码对应第j个目标特征的熵值;根据所述熵值确定所述第i个欺诈骚扰号码对应第j个目标特征的差异系数;根据所述差异系数确定所述第本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常通信号码的识别方法,其特征在于,包括:获取与目标特征对应的多组通信数据,对所述通信数据进行预处理以生成数据宽表,其中各组所述通信数据对应不同的通信号码;对所述数据宽表中的通信数据进行标准化处理,并将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分;获取与所述目标特征中的关键特征所对应的目标通信数据,将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所述通信号码进行分类,以输出与各所述通信号码对应的分类信息。2.根据权利要求1所述的方法,其特征在于,所述对所述数据宽表中的通信数据进行标准化处理,包括:当所述通信数据的值越大,所述通信号码为异常号码的概率越大时,根据公式(1)进行所述标准化处理:当所述通信数据的值越大,所述通信号码为异常号码的概率越小时,根据公式(2)进行所述标准化处理:其中,X
ij
为第i个通信号码对应第j个特征的通信数据,X
ij*
为对X
ij
进行标准化处理后得到的数据,min(X
j
)为所有通信号码对应的第j个特征中的最小通信数据,max(X
j
)为所有通信号码对应的第j个特征中的最大通信数据。3.根据权利要求1或2所述的方法,其特征在于,所述目标特征包括多个特征;所述将标准化处理后的所述通信数据输入至熵权法模型,通过所述熵权法模型根据不同特征对应的熵权值确定与各所述通信号码对应的异常评分,包括:获取与各所述特征对应的熵权值,将与各所述特征对应的熵权值和标准化处理后的通信数据相乘,以获取与各所述特征对应的子评分;将所有所述特征对应的所述子评分相加,以获取所述异常评分。4.根据权利要求1所述的方法,其特征在于,所述关键特征为呼出离散度和拒接次数;所述将与各所述通信号码对应的目标通信数据和异常评分输入至分类模型,通过所述分类模型对各所述通信号码进行分类,以输出与各所述通信号码对应的分类信息,包括:将与各所述通信号码对应且特征为呼出离散度和拒接次数的目标通信数据以及与各所述通信号码对应的异常评分输入至所述分类模型;通过所述分类模型根据预设规则对所述目标通信数据和所述异常评分进行处理,以获取与各所述通信号码对应的分类信息;其中,所述预设规则是根据异常评分、呼出离散度和拒接次数所确定的规则。5.根据权利要求4中所述的方法,其特征在于,所述分类模型为决策树模型或者随机森林模型;所述预设规则包括第一规则、第二规则和第三规则,所述第一规则的表达式为:异常评分>异常评分阈值and呼出离散度>第一呼出离散度阈值and拒接次数>第一拒接次数阈值,所述第二规则的表达式为:异常评分>异常评分阈值and呼出离散度∈呼出离散度区间
and拒接次数>第二拒接次数阈值,所...

【专利技术属性】
技术研发人员:贾育宋泽宇李斌
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1