一种虚假用户号码识别方法及装置制造方法及图纸

技术编号:10044335 阅读:218 留言:0更新日期:2014-05-14 15:45
本发明专利技术公开了一种虚假用户号码识别方法及装置,用以准确识别短信发送号码是否为虚假用户号码,提高垃圾短信的拦截效率。其中,虚假用户号码识别方法,包括:针对任一用户号码,获取该用户号码在单位时间内的通信话单,所述通信话单包括语音话单和短信话单;根据获取的语音话单和短信话单,分别确定该用户号码在单位时间内的语音行为特征和短信行为特征;若所述用户号码在单位时间内的语音行为特征和短信行为特征满足预设条件,确定所述用户号码为虚假用户号码。

【技术实现步骤摘要】

本专利技术涉及移动通信
,尤其涉及一种虚假号码识别方法及装置。
技术介绍
移动通信中的短信业务已成为移动用户之间常用的一种通信方式。由于短信的快捷与方便,可以通过短信进行信息交互或信息发布等。移动用户之间相互发送的普通短信主要用于信息的交流,基本上是两个人,或者多个人互相发送;而垃圾短信主要是利用短信进行不法信息的宣传,诈骗等活动,发送者不管接收用户是否愿意接收、是否能够接收到,按顺序或随机地在整个移动号码段内进行群发,其发送的短信数量与接收短信的用户号码数相当。传统的垃圾短信发现手段主要是基于内容关键字过滤技术,通过在短信网关设备或个人终端上人工发现、配置垃圾短信关键字,收到短信后,获取短信内容进行关键字匹配,对于任一条件或组合条件匹配符合的方可判定为垃圾短信。一方面,该种方法的匹配精度较低,容易造成判断失误,导致用户进行投诉。如:出现“枪支”关键字则确定为垃圾短信,而实际发送垃圾短信的用户可以轻松通过谐音绕过关键字过滤,把“枪支”一词改写为“抢支”、“枪知”、“枪zhi”等,达到垃圾短信发送的目的,且过滤因子粒度极难分割,如果过滤因子设置过于粗放,将导致部分垃圾短信被漏截,如果过滤因子设置过于精细,将可能导致合法短信被误截,同时,配置过多的过滤因子或者其组合需要消耗更多的硬件时间资源,严重降低通信效率,且过滤因子的产生或者变动在业务流程上需要经历人工分析、发现、确认的过程,导致系统运行成本较高,且存在严重的滞后性,无法适应当前复杂瞬变的通信环境。另一方面,垃圾短信发送用户通常通过虚假用户号码进行海量垃圾短信的发送,如果能够识别出短信发送号码为虚假用户号码,则可以从源头上拦截垃圾短信,提高垃圾短信拦截效率,而利用上述关键字匹配方法无法有效识别出短信发送号码是否为虚假用户号码。
技术实现思路
本专利技术实施例提高一种虚假用户号码识别方法及装置,用以准确识别短信发送号码是否为虚假用户号码,提高垃圾短信的拦截效率。本专利技术实施例提供一种虚假用户号码识别方法,包括:针对任一用户号码,获取该用户号码在单位时间内的通信话单,所述通信话单包括语音话单和短信话单;根据获取的语音话单和短信话单,分别确定该用户号码在单位时间内的语音行为特征和短信行为特征;若所述用户号码在单位时间内的语音行为特征和短信行为特征满足预设条件,确定所述用户号码为虚假用户号码。本专利技术实施例提供一种虚假用户号码识别装置,包括:获取单元,用于针对任一用户号码,获取该用户号码在单位时间内的通信话单,所述通信话单包括语音话单和短信话单;第一确定单元,用于根据获取的语音话单和短信话单,分别确定该用户号码在单位时间内的语音行为特征和短信行为特征;第二确定单元,用于若所述用户号码在单位时间内的语音行为特征和短信行为特征满足预设条件,确定所述用户号码为虚假用户号码。本专利技术实施例提供的虚假用户号码识别方法,通过对用户号码在单位时间内的语音话单和短信话单进行统计分析,以获取其在单位时间内的语音行为特征和短信行为特征,当其语音行为特征和短信行为特征满足预设条件时,确定该用户号码为虚假用户号码。这样,使得后续在进行垃圾短信拦截时,可以直接从源头上拦截垃圾短信,提高了垃圾短信的拦截效率。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本专利技术的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1为本专利技术实施例中,虚假用户号码识别方法的实施流程示意图;图2为本专利技术实施例中,虚假用户号码识别装置的结构示意图。具体实施方式为了能够准确识别短信发送号码是否为虚假用户号码,特别是针对异网间、非点对点短信发送号码的识别,以从源头上拦截垃圾短信,提高垃圾短信的拦截效率,本专利技术实施例提供了一种虚假用户号码识别方法及装置。以下结合说明书附图对本专利技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术,并且在不冲突的情况下,本专利技术中的实施例及实施例中的特征可以相互组合。实施例一如图1所示,为本专利技术实施例提供的虚假用户号码识别方法的实施流程示意图,包括以下步骤:S101、针对任一用户号码,获取该用户号码在单位时间内的通信话单;其中,通信话单包括语音话单和短信话单,通过对该用户号码全量语音、短信业务数据的采集、处理,提取出全量的通信话单信息。由于各通信交换机采集的通信话单格式不同,因此,可以根据数据处理的实际需要,对用户号码的通信话单进行预处理,使得每条通信话单具有相同的是格式。如每条语音话单可以表示为:VOICECDR(RecordType,CallingCode,CalledCode,StartDateTime,EndDateTime,Duration)其中:RecordType是语音话单类型;CallingCode是主叫号码;CalledCode是被叫号码;StartDateTime代表通话开始时间;EndDateTime:代表通话结束时间;Duration代表通话时长;每条短信话单可以表示为:SMSCDR(RecordType,CallingCode,CalledCode,StartDateTime,EndDateTime,MsgLen)其中:RecordType:短信话单类型(10表示接收,11表示发送);CallingCode是短信发送号码;CalledCode是短信接收号码;StartDateTime是短信发送时间;EndDateTime是短信接收时间;MsgLen:是短信内容长度,这样,可以降低后续确定该用户号码对应的语音行为特征和短信行为特征的处理复杂度,提高处理效率。需要说明的是,具体实施时,可以根据实际需要获取每一用户号码的通信话单,如果仅需要识别异网间短信发送号码进行识别时,可以针对每一用户号码,仅提取其网间通信话单,即该用户号码在单位时间内产生的异网语音话单和异网短信话单;或者仅针对该用户号码本网的通信话单进行提取,这样,后续在对提取到的通信话单进行处理时,能够减少数据处理数量,有效提高数据处理效率。特别地,为了保证为全量语音业务、短信业务数据快速高效的处理,本文档来自技高网
...

【技术保护点】
一种虚假用户号码识别方法,其特征在于,包括:针对任一用户号码,获取该用户号码在单位时间内的通信话单,所述通信话单包括语音话单和短信话单;根据获取的语音话单和短信话单,分别确定该用户号码在单位时间内的语音行为特征和短信行为特征;若所述用户号码在单位时间内的语音行为特征和短信行为特征满足预设条件,确定所述用户号码为虚假用户号码。

【技术特征摘要】
1.一种虚假用户号码识别方法,其特征在于,包括:
针对任一用户号码,获取该用户号码在单位时间内的通信话单,所述通信
话单包括语音话单和短信话单;
根据获取的语音话单和短信话单,分别确定该用户号码在单位时间内的语
音行为特征和短信行为特征;
若所述用户号码在单位时间内的语音行为特征和短信行为特征满足预设
条件,确定所述用户号码为虚假用户号码。
2.如权利要求1所述的方法,其特征在于,所述语音行为特征包括:语
音通话数量;以及
根据获取的语音话单,确定该用户号码在单位时间内的语音行为特征,具
体包括:
根据获取的语音话单,统计所述用户号码在单位时间的语音通话数量。
3.如权利要求2所述的方法,其特征在于,所述短信行为特征包括:短
信接收数量;所述预设条件包括:在单位时间内的语音通话数量不超过第一阈
值,且短信接收数量不超过第二阈值;以及
根据获取的短信话单,确定该用户号码在单位时间内的短信行为特征,具
体包括:
根据获取的短信话单,统计所述用户号码在单位时间的短信接收数量。
4.如权利要求3所述的方法,其特征在于,所述短信行为特征还包括:
短信发送数量;所述预设条件还包括:在单位时间内的短信发送数量超过第三
阈值;以及
根据获取的短信话单,确定该用户号码在单位时间内的短信行为特征,还
包括:
根据获取的短信话单,统计所述用户号码在单位时间内的短信发送数量。
5.如权利要求3或4所述的方法,其特征在于,所述短信行为特征还包

\t括:所发送短信中,包含相同字节内容的短信数量;所述预设条件,还包括:
在单位时间内发送的、包含相同字节内容的短信数量超过第四阈值;以及
根据获取的短信话单,确定该用户号码在单位时间内的短信行为特征,还
包括:
根据获取的短信话单,统计所述用户号码在单位时间内的所发送短信中、
包含相同字节内容的短信数量。
6.如权利要求1所述的方法,其特征在于,还包括:
若所述用户号码在单位时间内的语音行为特征和短信行为特征满足预设
条件,在确定所述用户号码为虚假用户号码之前,利用所述用户号码进行语音
拨测,获得所述用户号码对应的应答提示音音频文件;
分析所述音频文件;以及
确定分析结果为空号类型号码对应的应答提示音。
7.一种虚假用户号码识别装置,其特征在于,包括:
获取单元,用于针对任一用户号码,获取该用户号码在单位时间内的通信
话单,所述通信话单包括语音...

【专利技术属性】
技术研发人员:王卫武勇周连华许小泉刘炎
申请(专利权)人:中国移动通信集团上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1